Социальная сеть «Так и было написано» сделана с помощью конструктора Taba.ru. Хотите создать свою социальную сеть?
больше не показывать
Поиск по taba.ru
Каталоги taba.ru
Управление сетью
Вступить в сеть
Управление сетью

Так и было написано

 
  Вы только что начали читать фразу, чтение которой
вы уже заканчиваете…         А если вы это сейчас
читаете, значит все уже прочли.
03/10/2009 Google Docs учится распознавать тексты

В Google Docs API тестируется функция оптического распознавания символов (OCR) в изображениях. Для проверки возможностей можно зайти на демо-страницу, которая наглядно даст понять, как же это всё работает.

Немного от меня:

С технологией оптического распознавания текста я познакомился где-то в 1997 года, когда купил свой первый, тогде ещё ручной, чёрно-белый сканер Genius ScanMate 256 (кстати, всё ещё рабочий). К сканеру прилагалась программа Direct OCR на 3х дюймовой дискете (блин, откуда-то из подсознания все эти названия всплывают), которая всеми своими силами пыталась доказать, что можно быстро и почти без ошибок текст из книги ввести в компьютер. Ну, доказательства были не очень. FineReader, с которым я познакомился позже, делал это качественнее. Тема распознавания меня заинтересовала, я потратил довольно много времени на научно-популярные статьи о технологиях OCR.

В 2001 году я готовил дипломную работу по web-технологиям. Долго думал о том, куда приложить знания. Поскольку меня интересовала технология OCR, я задумал совместить WEB и распознавание текстов. За само распознавание у меня должен был отвечать FineReader. С друзьями мы "разобрали" FineReader на отдельные DLL и выяснили, как вызывать отдельные функции этих библиотек, передавая двоичные данные изображений, и как получать обратно распознанный вариант текста. Над этим всем был построен простейший веб-интерфейс, чтобы загружать картинки, запускать распознавание и получать результат.

Первым ограничением на то время для нас оказалась смешная пропускная способность интернет. Страница A4, отсканированная в качестве 200 точек на дюйм и сохранённая в формате TIFF (который только и воспринимала программа FineReader) могла занимать несколько мегабайт в серых тонах, а если кто по ошибке или незнанию цветной вариант отсканирует, то объём увеличивался в три-четыре раза. Такой огромный по тем временам файл даже по локальной сети пересылался и обрабатывался с трудом, а через публичный Интернет - вообще трудно выполнимая задача.

Второй фактор - стоимость. При такой скорости пересылки файлов отсканированных страниц каждая страница стоила дорого. Мы также приняли во внимание, что обычно используются взломанные версии программ распознавания текстов, который достаются бесплатно или за копейки.

Третий фактор - востребованность. Чтобы человек стал пользоваться онлайн-сервисом по распознаванию текста, надо как минимум три фактора: наличие сканера, наличие Интернет и отсутствие возможности самостоятельно распознать текст. Было трудно  представить себе большое количество таких "криворуких" и "глупых" пользователей.

Проект был реализован, но оставлен "под сукном" как бесперспективный.

Два года назад я предлагал своим коллегам по работе обдумать вариант повторной реализации проекта. Ситуация изменилась: интернет стал быстрее (файлы mp3 уже давно больше по объёму, чем отсканированная страница в формате JPG), сканеры стоят чуть ли не повсеместно (а ещё текст можно просто сфотографировать), все стараются пользоваться лицензионным ПО либо вообще не нагружать себе голову всякими программами, ведь в Интернет уже можно сделать почти всё, что раньше делали только специальные программы. У FineReader есть API, а FLASH позволяет сделать достаточно удобный web-интерфейс для управления загрузкой и распознаванием. Но мы не пришли к общему мнению и, можно сказать, упустили возможность сделать полезный и востребованный сервис. Сейчас компания ABBYY уже сама реализовала онлайн-версию Fine Reader для распознавания текстов.

А теперь вернусь к теме статьи.

Для того чтобы распознать текст, сперва необходимо будет войти под своей учётной записью в «Гугле». Сразу после авторизации появится возможность загрузить изображение в высоком разрешении (до 25 мегапикселей, но размером не более 10 Мб) в формате jpg, png или gif.

Выбрав изображение и нажав кнопку «Start OCR import», придется подождать около минуты, прежде чем распознанный текст появится в вашем «Гугл-доксе». Но это всё очень оптимистично. На деле же всё немного иначе: функция оптического распознавания символов понимает лишь латинский алфавит, игнорируя кириллицу. С другой стороны, не стоит забывать про то, что функция только-только появилась, а поэтому, вполне вероятно, что вскоре будет и поддержка русского текста.

Ссылки по теме:
* ABBYY Fine Reader online
* Демо-страница распознавания текста Google Docs

Источник

Метки: google, web, online, ocr, service
    1
397
опубликовал: copist
Комментарии (1) Оставить комментарий
copist  05.10.2009 08:54 #

Написал более подрбную обзорную статью на ХабраХабре

Отредактировано автором. 23.10.2009 14:28
Недостаточно прав
Чтобы оставлять комментарии, необходимо вступить в сеть.

Моя панель

Добро пожаловать в сеть «Так и было написано»
или войдите

Реклама

 на страницах социальной сети "Так и было написано"

Метки

ajax facebook google javascript logo microsoft service taba web игры опрос праздник программировани е работа разработка сервис социальная сеть тестирование фейсбук юмор
Показать все метки