SİU 2022’de Ar-Ge Bildirimizi Sunuyoruz

Erkan Aytac
Nisan 25, 2022
  • 2978

TUBİTAK tarafından desteklenen Ar-Ge projemiz Datamin 2 kapsamında geliştirdiğimiz “Yapılandırılmamış Dijital Belgelerin Düzeninin Çözümlenmesi İçin Bir Yaklaşım” isimli çalışmamız, Sinyal İşleme ve İletişim Uygulamaları Kurultayı (SİU)’da sunulmak üzere kabul edildi.

Multimedya dosyaların üzerinde kişisel verilerin tespitini amaçlayan Datamin 2 projemiz, ses ve video dosyalarında kişisel veri, çoklu ortam verileri üzerinde kişisel bilgi içeren doküman ve nesne tanımayı, dokümanların içinde bulunan parmak izi, imzaları tespit etmeyi hedefliyor.

Datamin 2 projesinin birinci 6 aylık döneminde yer alan çoklu ortam verileri üzerinde kişisel bilgi içeren doküman ve nesne tanıma modülü başarı ile tamamlandı. Bu yıl Bahçeşehir Üniversitesi tarafından düzenlenen ve 16-18 Mayıs tarihlerinde gerçekleşecek SİU 2022 konferansında çalışmanın akademik çıktısı olarak hazırlanan bildirinin sunuşu yapılacak.

Çalışmanın Amacı

Kişisel verilerin korunabilmesi için bu verileri içeren belgelerin içerisinden kişisel bilgilerin çıkarılabilmesi ve/veya bilginin türünün belirlenip yerinin tespit edilmesi gerekmektedir. Makine öğrenmesi, doğal dil işleme, görüntü işleme, optik karakter tanıma vb. alanlarda uygulanılan yöntemler kullanılarak, standart bir yapıya sahip bir form veya belgenin içerisindeki kişisel bilgiler belirlenebilmektedir. Ancak standart bir yapısı olmayan belgenin düzeninin çözümlenmesi ve belgenin içerisindeki farklı belge yapılarının ayrı ayrı işlenmesi gerekebilmektedir. Özellikle birden fazla belgenin beraber taranarak tek bir belge haline getirilmesi durumlarında, belgenin düzeninin çözümlenmesi ve her bir belgenin tespiti zorunluluk arz etmektedir. Bunu gerektiren bir diğer sebep de taranan belgelerin metin yönleri veya taranma düzeninin aynı yönde olmama durumlarıdır. Örnek olarak, beraber taranmış bir kimlik ve ikametgâh belgesini ele aldığımızda, kimlik yukarıdan aşağıya okunacak düzende iken ikametgâh belgesi de ters yerleştirilmiş olup, sağdan sola okuma düzeninde olabilmektedir. Bunların yanında, birden fazla ve daha farklı açılardan taranmış belgeleri içeren daha karmaşık belgeler de olabilmektedir. Yapılan bu çalışmanın sonucunda bu karışık belge düzeni çözümlenmiş ve %94’lük bir başarı yakalanmıştır.

Geçmiş Çalışmalar

Datamin 2 projesinin ilk versiyonu olan Datamin 1 projesi kapsamında daha önce; “Türkçe Kural Tabanlı Resmi Doküman Tipi Tespiti” bildirisi SİU 2021’de, “A Hybrid Approach for Turkish Personal Data Discovery and Profilling” bildirisi 9 Ağustos 2021 tarihinde Tubitak Journal of Electronic and Computer Sciences dergisinde yayınlamıştı.

16-18 Mayıs tarihleri arasında düzenlenecek konferansa sunuşumuzu dinlemek üzere bekliyoruz.



İlgili İçerik
Duyurular

Generative AI: Üretken Yapay Zeka ile Yaratıcılığın Buluşması

Generative AI, kendinden öğrenen algoritmaları kullanarak yeni veriler oluşturabilen yapay zekâ sistemlerini ifade eder. Bu sistemler, önceden belirlenmiş bir kural seti veya model üzerinden gerçekçi ve özgün içerikler üretebilirler.

selen guvenc Mayıs 20

ISO/IEC 42001:2023 Yapay Zekâ Yönetim Sistemi

ISO/IEC 42001, kuruluşlar içerisinde Yapay Zekâ Yönetim Sisteminin (AIMS) kurulması, uygulanması, sürdürülmesi ve sürekli olarak iyileştirilmesine yönelik gereksinimleri belirleyen uluslararası bir standarttır.

selen guvenc Mayıs 20

Perakende Günleri Yaklaşıyor: Mobildev Standımıza Sizleri Bekliyoruz!

Mobildev olarak, Perakende Günleri’nde Kurumsal Mesajlaşma Sponsoru olarak yerimizi aldık. Hall 3’de bulunan 316 numaralı standımızda, sektördeki işletmelerin dönüşümüne katkı sağlayacak çözümlerimizi ve uzmanlığımızı sergileyeceğiz.

selen guvenc Mayıs 20

Mobildev&Teknosa 30 Mayıs'ta Perakende Günleri'nde!

Teknosa Müşteri Deneyimi, Crm ve Veri Analitiği Grup Müdürü Duygu Bayram ile Mobildev Kurucusu ve Genel Müdürü Ozan Özgür Erdoğan, uzmanlık sahnesinde gerçekleştireceğimiz oturumda bir araya geliyor!

selen guvenc Mayıs 20

Sosyal Medyada İtibar ve Kriz Yönetimi

Mobildev Pazarlama Sohbetleri webinar serimiz, 24 Mayıs Cuma günü gerçekleşecek olan "Sosyal Medyada İtibar ve Kriz Yönetimi" konulu on altıncı webinarı ile devam ediyor.

selen guvenc Mayıs 19

"Sağlık Sektöründe Devrim Yaratan Dijital Pazarlama Stratejileri 2024" Şimdi YouTube ve Spotify'da Yayında!

“Sağlık Sektöründe Devrim Yaratan Dijital Pazarlama Stratejileri 2024” konulu webinarımız; kaçıranlar veya tekrar izlemek isteyenler için Youtube, dinlemek isteyenler için Spotify kanallarımıza yüklenmiştir.

selen guvenc Mayıs 17

Bültene Üye Ol

İşinizi geliştirmenize katkı sağlayacak, başarılı örnekleri, sektörel gelişmeleri ve kampanyaları kaçırmayın.