Destek Vektör Makineleri ile Büyük Ölçekli Verilerde Hassas Anomali Tespiti ve Optimizasyon Teknikleri


Turgut K.

Bilgisayar Bilimleri ve Teknolojileri Dergisi, cilt.6, sa.1, ss.37-43, 2025 (Hakemli Dergi)

Özet

Bu makalede, büyük ölçekli verilerde anomali tespiti için Destek Vektör Makineleri (SVM) kullanımı ele alınmıştır. Anomali tespiti, normal davranışlardan sapmaları belirlemeyi amaçlayan önemli bir veri madenciliği ve makine öğrenimi problemidir. SVM, güçlü sınıflandırma yetenekleri ve esnek kernel fonksiyonları sayesinde yaygın olarak kullanılan bir algoritmadır, ancak büyük veri setlerinde uygulanması çeşitli zorluklar barındırır. Makale, büyük ölçekli veri setlerinde SVM'nin verimli ve etkili bir şekilde uygulanmasını sağlamak için yeni yaklaşımlar ve optimizasyon tekniklerini incelemektedir. Çekirdek triklerinin kullanımı, parametre optimizasyonu, veri alt kümeleme ve yaklaşık teknikler gibi yöntemler detaylandırılmıştır. Ayrıca Pegasos ve LIBSVM gibi hızlı ve verimli SVM algoritmalarının kullanımı ele alınmıştır. Deneysel çalışmalar, önerilen yöntemlerin etkinliğini ve verimliliğini değerlendirmek için çeşitli büyük ölçekli veri setleri üzerinde gerçekleştirilmiştir. Elde edilen sonuçlar, SVM'nin büyük veri setlerinde anomali tespitinde yüksek doğruluk ve genelleme yeteneği sağlayabileceğini göstermektedir. Bununla birlikte, hesaplama maliyeti, bellek kullanımı ve veri dengesizliği gibi zorlukların optimize edilmiş yöntemler ve yeni teknolojiler kullanılarak aşılması gerektiği vurgulanmıştır.
Sonuç olarak, makale büyük veri setlerinde anomali tespiti için SVM'nin performansını artırmak amacıyla çeşitli optimizasyon teknikleri ve yeni yaklaşımlar sunmaktadır. Gelecekteki araştırmalar, derin öğrenme teknikleri, çevrimdışı ve çevrimiçi öğrenme yöntemlerinin kombinasyonu ve dağıtık hesaplama teknikleri gibi alanlarda SVM'nin performansını daha da artırmayı hedeflemelidir.

This article discusses the use of Support Vector Machines (SVM) for anomaly detection in large-scale data. Anomaly detection is an important data mining and machine learning problem that aims to identify deviations from normal behavior. SVM is a widely used algorithm thanks to its powerful classification capabilities and flexible kernel functions, but its implementation in large data sets poses various difficulties. The article examines new approaches and optimization techniques to enable efficient and effective application of SVM on large-scale datasets. Methods such as the use of kernel metrics, parameter optimization, data subsetting and approximate techniques are detailed. Additionally, the use of fast and efficient SVM algorithms such as Pegasos and LIBSVM is discussed. Experimental studies have been conducted on various large-scale datasets to evaluate the effectiveness and efficiency of the proposed methods. The results obtained show that SVM can provide high accuracy and generalization ability in anomaly detection in large data sets. However, it has been emphasized that challenges such as computational cost, memory usage and data instability must be overcome by using optimized methods and new technologies.
In conclusion, the paper presents various optimization techniques and new approaches to improve the performance of SVM for anomaly detection in large data sets. Future research should aim to further improve the performance of SVM in areas such as deep learning techniques, combination of offline and online learning methods, and distributed computing techniques.