ABBA Sınıflandırma
Abba Doküman Sınıflandırma Platformu Nedir?
ABBA, DDI Teknoloji ARGE birimi tarafından TÜBİTAK 1507 desteği ile geliştirilen yerli bir sınıflandırma çözümüdür. Sektör bağımsız olarak, bir çok sınıflandırma probleminin çözümüne kolaylıkla uyarlanabilir. Manuel işlemlerin otomatikleştirilmesiyle iş gücü tasarrufu yapılır. Tüm dijitalleşme işlem, manuel sürece göre 5 kat daha kısa sürede tamamlananır. Sınıflandırma işlemindeki insan faktörüne bağlı hataların önüne geçilmiştir.
FAYDALAR
Sınıflandırma işlemindeki insan faktörüne bağlı hataların önüne geçilmişti
Tüm dijitalleşme işlemi, manuel sürece göre 5 kat daha kısa sürede tamamlanmıştır.
Manuel işlemlerin otomatikleştirilmesiyle iş gücü tasarrufu yapılmıştır.
ABBA ile Örnek bir Başarı Hikayesi
ABBA ile bir kurumun fiziksel arşivinin dijitalleştirilmesi işlemi yapılmıştır. Kurumun arşivi bünyesindeki 3.500.000 sayfa evrak yığın halinde taranarak bilgisayar ortamına aktarılmıştır. ABBA her bir sayfanın içeriğini teker teker analiz ederek sayfanın sınıfını makine öğrenmesi algoritmalarıyla belirlemiş ve bir arada olması gereken sayfaları gruplayarak ayrıştırma işlemi yapmıştır. ABBA ile sınıflandırılan ve ayrıştırılan evraklar, doğrudan kurumun dijital arşivine kazandırılmıştır.
Çalışma Aşaması
Eğitim aşaması tamamlandıktan sonra ABBA çalışmaya hazırdır. Çalışma anında sınıflandırılacak doküman ya da doküman grubu ABBA’ya gönderilir. ABBA her bir sayfa içinde kendi çıkardığı özellikleri arar ve bu özellikleri kendi sınıflandırma algoritmasına gönderir. Ardından algoritma, doküman için en uygun sınıf bilgisini belirler ve kullanıcının belirttiği sistem içerisine gönderir.
Eğitim Aşaması
ABBA’nın bir sınıflandırma problemine uyarlanmasındaki ilk aşama eğitimdir. Eğitim aşamasında, ABBA’ya her sınıf için yeterli sayıda evrak örneği verilir. Bu aşamada sadece dokümanın kendisi ve sınıf bilgisi sisteme iletilir. Bunun dışında herhangi bir özellik çıkarımı işlemi gerçekleşmez. ABBA kendisine verilen her bir örneği analiz eder ve sınıflar için özellik çıkarımı işlemini otomatik olarak gerçekleştirir. Son olarak da kendi belirlediği özelliklerle, probleme özel sınıflandırma algoritmasını oluşturur.
ÖZELLİKLER
Dokümanların metin içeriklerini akıllı şekilde analiz etmeye yarayan, Türkçe dili için özel olarak geliştirilmiş doğal dil işleme kabiliyeti
Metin formatında olmayan içerikler için OCR (Optik Karakter Tanıma) özelliği
Bir dokümanın hem içeriğine (metin bilgisi), hem de şekilsel görünümüne göre sınıflandırma özelliği
Makine öğrenmesi yöntemlerine ek olarak kurallarla da desteklenebilme özelliği
Makine öğrenmesi yöntemleri ile akıllı sınıflandırma