Evrişimli sinir ağı kullanılarak yaprak resimlerinin sınıflandırılması
Citation
Camgozlu, Y. (2021). Evrişimli sinir ağı kullanılarak yaprak resimlerinin sınıflandırılması. (Yüksek Lisans Tezi). İskenderun Teknik Üniversitesi / Mühendislik ve Fen Bilimleri Enstitüsü, Hatay.Abstract
Çevremizde bulunan birçok bitki hakkında bilgi sahibi değiliz, yararları ve zararları konusunda halk arasındaki bilgilerle hareket etmekteyiz. Bu gibi durumlarda zehirli olmasına rağmen şifalı olarak bilinen bitkilerin yanlış kullanılması ölüme kadar gidebilecek pek çok soruna yol açmaktadır. Bu gibi durumlarda bitkilerin tanınması uzmanlık gerektirmektedir. Bu sorun gelişen teknoloji ile uzmanlık gerektirmeden giderilebilecek bir eksikliktir. Bu sebeple yaprak resimleri üzerinde yapay zeka teknikleri kullanılarak hazır bir sistem oluşturulması amaçlanmıştır. Yapay zeka teknolojilerinin ön planda olduğu bugünlerde, bu alanda pek çok yöntem kullanılmaktadır. Bu yöntemlerden biri derin öğrenmedir. Çoğu alanda derin öğrenme yöntemlerinin uygulandığını söyleyebiliriz. Yüz tanıma, ses tanıma, otonom araçlar, siber tehdit analizleri, sağlık sektörü gibi alanlardır. Bu yöntem kullanılırken tanımlama, sınıflandırma, tahmin etme gibi pek çok amaca hizmet eder. Derin öğrenme algoritmalarından biri olan evrişimsel sinir ağı girdi olarak aldığı verilerle özellikleri öğrenerek, bu özellikler yardımıyla istenilen sonucu elde eder. Literatürde farklı öznitelik çıkarım yöntemleri kullanılarak elde edilen verilerin farklı sınıflandırma yöntemleri ile kullanıldığı görülmektedir. Oluşturulan evrişimli sinir ağı modellerinden veya önceden eğitilmiş modellerden çıkarılan özniteliklerin farklı sınıflandırma yöntemleri ile kullanılması gibi yaklaşımlar bulunmaktadır. Bu tez çalışmasında, farklı sayıda yaprak görüntülerinden oluşan veri setleri kullanılmıştır. Tüm resimleri içeren 270 farklı türden oluşan tek bir büyük veri seti oluşturulmuş ve bu veri setine özel yeni bir evrişimli sinir ağı modeli eğitilerek sonuçları incelenmiştir. Renkli veya gri resim farkı, arka plan renginin etkisi, farklı görüntü boyutu ve filtre boyutu gibi değişikliklerin başarıma etkisi incelenerek iyileştirme çalışmaları yapılmıştır. Bu çalışmalar sonucu elde edilen verilerle oluşturulan modelin yapısı ve bu modelin eğitiminde kullanılacak verilerin durumu belirlenmiştir. Oluşturulan evrişimli sinir ağı modeli kullanılarak yaprak sınıflandırılması yapılmıştır, ayrıca bu model kullanılarak öznitelik öğrenimi yaklaşımı ile öznitelik dönüşümü gerçekleştirilmiş ve farklı sınıflandırma yöntemleri ile başarımları incelenmiştir. Veri setinin büyüklüğü sonucu eğitim için gerekli güçlü donanım ihtiyacı sebebiyle eğitim ihtiyacı olmayan önceden eğitilmiş modellerin kullanılması ve sonuçların karşılaştırılması sağlanmıştır. Bu amaçla belirlenen 4 farklı önceden eğitilmiş modelden öznitelikler çıkarılarak aynı sınıflandırma yöntemleri ile sınıflandırılmıştır. Yapılan sınıflandırma işlemleri sonucu elde edilen veriler değerlendirilerek düşük işlem gücüne sahip donanımlarda en iyi sonucun elde edilebileceği bir yaklaşımın belirlendiği ve 270 türe sahip veri seti için %89 eğitim, %86 oranında test başarımı sağlanmıştır. We do not have information about many plants around us, we act with the information among the people about their benefits and harms. In such cases, the wrong use of herbs known as medicinal, although toxic, causes many problems that can lead to death. In such cases, expertise is required to identify plants. This problem is a deficiency that can be eliminated with developing technology without requiring expertise. For this reason, it is aimed to create a ready system using artificial intelligence techniques on leaf images. Nowadays, where artificial intelligence technologies are at the forefront, many methods are used in this field. One of these methods is deep learning. We can say that deep learning methods are used in most areas. Areas such as face recognition, voice recognition, autonomous vehicles, cyber threat analysis, healthcare. While using this method, it serves many purposes such as definition, classification, and prediction. Convolutional neural network, one of the deep learning algorithms, learns the features with the data it receives as input and obtains the desired result with the help of these features. It is seen in the literature that the data obtained by using different feature extraction methods are used with different classification methods. There are approaches such as using the features extracted from the created convolutional neural network models or pre-trained models with different classification methods. In this thesis, data sets consisting of different numbers of leaf images were used. A single large data set consisting of 270 different species including all images was created and a new convolutional neural network model specific to this data set was trained and the results were examined. Improvement studies have been carried out by examining the effect of changes such as color or gray image difference, effect of background color, different image size and filter size. The structure of the model created with the data obtained as a result of these studies and the status of the data to be used in the training of this model were determined. Leaf classification has been made using the convolutional neural network model. Also, using this model, feature transformation has been performed with the approach of feature learning and its performance has been investigated with different classification methods. As a result of the size of the data set, it was ensured that pre-trained models that do not need training due to the need for powerful equipment for using and the results were compared. For this purpose, features were extracted from 4 different pre-trained models and classified with the same classification methods. By evaluating the data obtained as a result of the classification process, an approach to achieve the best result in hardware with low processing power was determined and 89% training, 86% test performance were achieved for the data set with 270 species.