Сообщения

Сообщения за марта 30, 2008

OpenSource OCR программа!!!

Ну вот, наконец то, свершилось то, о чем так давно мечтали обладатели сканеров. Появилась достойная альтернатива коммерческим системам распознавания текста. Хочу отметить, что одной из таких систем является Tesseract, проект достаточно молодой но перспективный, поскольку развивается самим Google. Единственным недостатком, который пока, что не позволяет использовать систему русскоговорящим пользователям - отсутствие полноценного распознавания кириллических тестов, но я думаю в будущем эта самая поддержка должна появится. Сайт проекта - Tesseract И на добавок, по словам специалиста Google Люка Винсента, "Tesseract имеет ряд ограничений, в частности, она плохо определяет колонки и другие виды макетирования в документах, не принимает цветные или полутоновые изображения. Но на сегодняшний день, по его мнению, это лучшая OCR с открытым кодом." Но теперь появилась еще одна система, достаточно старая и известная - это CuneiForm, буду чи ранее закрытой коммерческой системой, разработ