Bölütlenmiş Karakterler, optik karakter tanıma(OCR) gibi uygulamalarınızda test/eğitim amacıyla kullanılabilecek 0-9 arası rakam ve büyük harflerden oluşan bir veri setidir. Veriler gerçek dünyadan edinildiği için veriler gürültülüdür.
An itibariyle hayli eksik olduğundan varolan veri setinizi genişletmek amacıyla kullanabilirsiniz.
Yanlışlıkları bitkidoku *AT* anlak *NOKTA* com eposta adresine bildirirseniz sevinirim.
Verisetinden örnekler:
Hangi karakterden kaç adet var?
| Karakter | adet |
| 0 | 100 |
| 1 | 114 |
| 2 | 131 |
| 3 | 92 |
| 4 | 111 |
| 5 | 92 |
| 6 | 102 |
| 7 | 87 |
| 8 | 124 |
| 9 | 105 |
| A | 191 |
| B | 70 |
| C | 69 |
| D | 4 |
| E | 6 |
|
| Karakter | adet |
| F | 1 |
| G | 3 |
| H | 31 |
| K | 92 |
| L | 6 |
| M | 58 |
| N | 5 |
| O | 4 |
| P | 47 |
| T | 26 |
| V | 1 |
| X | 144 |
| Y | 4 |
| Z | 2 |
| . | . |
|
toplam: 1821
Internet uzerinde bulunan benzer veri setlerinden bazilari:
[...] Daha önce OCR sistemlerinizi test etmek ya da eğitmek için kullanabileceğiniz sınırlı bir karakter verisetini burada paylaşmıştım. [...]
ReplyDelete