Google тестирует сервис распознавания текста

отметили
50
человек
в архиве
Google тестирует сервис распознавания текста
Google Docs тестирует новый сервис, который позволяет выполнять OCR (распознавание символов) по загруженным изображениям. Имеется работающий прототип, в котором вы можете загрузить изображение JPG, GIF, или PNG высокого разрешения (размером менее 10 МБ), и Google Docs выделит текст и преобразует его в новый документ.
Google утверждает, что "операция в данный момент занимает до 40 секунд", и небольшая проверка показывает, что сервис еще не очень надежен: он медленный и часто выдает ошибку.
Результат далеко не идеален и часто содержит ошибки, но зато сервис бесплатен и постоянно улучшается.

Google спонсирует разработку ПО распознавания с открытым исходным кодом под названием OCRopus, но пока неясно, базируется новый онлайн-сервис Google Docs именно на ней.
Добавил u.nik.myopenid.com u.nik.myopenid.com 30 Сентября 2009
Комментарии участников:
furman76.blogspot.com
0
furman76.blogspot.com, 30 Сентября 2009 , url
У evernote эта технология уже давным давно работает, в боевом режиме.
u.nik.myopenid.com
0
u.nik.myopenid.com, 30 Сентября 2009 , url
У Evernote немного другая технология. Они не пытаются точно распознать слово, для формирования документа, а кладут в индекс для поиска все возможные черновые результаты "может так, а может этак", считая что пользователь сам знает что искать.
heterodin
0
heterodin, 30 Сентября 2009 , url
вот отгрызают просто куски рынков смежных.
мне кажется, что окупиться и оправдаться сервис сможет по многим параметрам, в том числе при помощи незадокуметированых возможностей и инструментов и незадекларированых задач.

это правда очень инетресно.
kuroi-kaze-85.livejournal.com
0
kuroi-kaze-85.livejournal.com, 30 Сентября 2009 , url
Они ещё распознавателем Tesseract занимались.


Войдите или станьте участником, чтобы комментировать