Kitapların sayfaları olduğunu, restorandan çıkarken para ödendiğini, yağmurda yürüyünce ıslanıldığını ve bunun (çoğu zaman) istenmeyen bir şey olduğunu ne zaman ve kimden öğrendiğinizi hatırlıyor musunuz? Hepimizin sadece bilmekle kalmayıp diğer tüm insanların da bildiğine emin olduğumuz bu bilgiler çoğu zaman asla dile dökülmüyor, ansiklopedilerde veya kitaplarda yer almıyor ama aynı zamanda hayatımızı sürdürürmek için vazgeçilmezler. Sağduyu adını verdiğimiz bu bilgi havuzu, diğer insanlarla anlamlı ilişkiler kurmamızı sağlayan asgari müşterek; bazı çalışmalar sıradan bir insanın sahip olduğu sağduyu bilgisinin ancak milyonlarca önerme ile temsil edilebileceğini tahmin ediyor (referanslar için bkz. http://web.media.mit.edu/~push/ConceptNet-BTTJ.pdf).
İnsanlarla "zekice" iletişime geçen yazılımlar geliştirirken karşılaşılan en büyük zorluklardan birisi yapay zeka programlarına bu bilgileri vermenin kolay bir yolunun olmayışı. Tanımı gereği ansiklopedilerde bulunmayan sağduyu bilgisini bilgisayarların da işleyebileceği şekilde temsil etmek 80'lerin başından beri yapay zekanın aktif araştırma konularından birisi. Bugüne kadar bu alanda kullanılan yöntemlerden bir tanesi filozofları, bilgisayar mühendislerini ve dilbilimcileri bilgisayarların başına oturtup sistematik bir şekilde sağduyu önermeleri yazıp, bilgisayarlar tarafından işlenebilecek bir biçimde saklamak oldu (http://www.cyc.com). Diğer bir yöntem ise internette bu işi yapmaya gönüllü insanları bir araya getirip sıradan insanların sağduyu uzmanlığından faydalanmak oldu (http://conceptnet.media.mit.edu/).
Concept Game ise veri madenciliği ve "bir işe yarayan oyunlar" (games with a purpose) yaklaşımını bir araya getiren bir projenin parçası. Metin kaynağı olarak Wikipedia'yı kullandık ve aynı cümle içinde geçen kavramları içeren toplam 250 milyon önerme ürettik. Mekanik öğrenme teknikleri ile bu 250 milyon önerme içinden doğru olma ihtimali yüksek olanları seçiyoruz ama yine de elimizde çok büyük ve hâlâ anlamsız önermeler içeren bir yığın kalıyor. Oyun ise insanların bir yandan oyun oynayıp bir yandan çıkarılan bilgi parçacıklarını kalite kontrolünden geçirmesini sağlıyor. Sonuçta elde edilen yüksek kalitedeki veri istersek yeniden veri madencisine eğitim girdisi olarak geri gönderiyoruz, istersek yapay zeka programlarının kullanabileceği bir veri kümesi olarak hizmete sunuyoruz.
Aslında sağ duyu verilerini bu şekilde toplama fikri çok hoşuma gitti. Zira yapay zeka konusunda uzun süredir kafamı karıştıran bir konuydu. "Düzenek tamam fakat e bur da mantık oluşturabileceğimiz veri yok?!." diye düşünürdüm.
saygı, sevgi.