Google OCR veri seti
Daha önce OCR sistemlerinizi test etmek ya da eğitmek için kullanabileceğiniz sınırlı bir karakter verisetini burada paylaşmıştım.
Verisetine ihtiyaç duyanlar bunları elde etmenin ne kadar zor olduğunu bilirler. Hayat kurtarıcı sürpriz Google’dan geldi. ICDAR2007‘de (Uluslararası Döküman Analiz ve Tanıma Konferansı) konuşmacı olarak yer alan Luc Vincent’ın müjdelediğine göre, Google şimdiye kadar Google Book Search sürecinde elde ettikleri, telif hakkı olmayan, verileri bir araya getirip araştırmacılar için kapsamlı bir veriseti hazırlama sürecine girmiş.
İlk ürünleri bir an evvel alabilmemiz umuduyla.
Kaynak: Google Book Search: Document Understanding on a Massive Scale, Vincent L.
08.01.2008
Yazar: bitkidoku
Kategorİ: geek,programlama
Hiç yorum yok
Amacımız, zihinlerimizin birer kopyasını dijital ortama aktarıp, bu simulasyonu uzay boşluğuna fırlatmaktır. Başlangıç olarak bu tip işlerle altyapımızı geliştirmekteyiz (evet).