-Метки

Банан Чеснок апельсин базилик баклажаны без яиц бисквит блины булочки видео вишня вредители выпекать выпечка выращивание вяленые помидоры горчица грибы десерт джем дневник дрожжи желатин заготовки закуски запекать здоровье изюм йогурт кабачки какао капуста картофель кекс кефир кокосовая стружка компьютер консервация котлеты крахмал кукуруза куриное филе куриный фарш курица лимон лук манка мед миндаль молоко морковь новый год овсянка огород огурцы онлайн орехи открытки перец печень куриная печенье пирог полезные свойства помидоры портативная пост постная выпечка программы рамочки растительное масло рис розы рулет рыба сад сайт салат свекла сгущенка сельдерей сливки сливочное масло сметана соус спицы сыр творог торт тыква уроки уход фасоль фотографии фотошоп цветочные рамочки цветы шампиньоны шоколад яблоко яйца

 -Рубрики

 -Поиск по дневнику

Поиск сообщений в kolovor

 -Подписка по e-mail

 

 -Статистика

Статистика LiveInternet.ru: показано количество хитов и посетителей
Создан: 22.01.2013
Записей:
Комментариев:
Написано: 6390


Как распознать текст с картинки онлайн – обзор веб-приложений

Четверг, 19 Марта 2015 г. 23:57 + в цитатник
 
 

Распознаем текст с картинкиЕсли у вас возникает необходимость распознать текст с картинки или файлов PDF и у вас нет в наличие специального программного обеспечения, то вы попали по адресу. В основном для этой задачи используют программу FineReader, но она стоит довольно дорого. Не покупать же нам программу из-за одной или двух картинок, которые хотим распознать и конвертировать в документ. В этом случае помогут специальные онлайн сервисы, созданные именно для распознания текста с картинки. Давайте рассмотрим некоторые из них.

Я постараюсь рассмотреть бесплатные и платные онлайн сервисы, потому что на сегодняшний день бесплатного становиться все меньше и меньше. Рассмотрим сервисы для распознания текста с картинки или PDF-файлов 

OCR CONVERT

 

OCR CONVERT – бесплатное веб-приложение, с помощью которого можно распознать текст с картинки онлайн. В дальнейшем текст может быть отредактирован, отформатирован и переведен в электронный документ. OCR может быть использован для конвертации книг и документов в электронный формат и для автоматизации различных бизнес-процессов.

Для начала загружаем картинку в веб-приложение, нажав на кнопку Обзор (выбираем файл), выбираем язык (русский язык), и нажимаем на кнопку Process для распознания текста.

Особенности сервис OCR Convert:

  • Точное распознание для преобразования текста;
  • Поддерживает PDF, GIF, BMP, JPEG в качестве входного файла;
  • Поддерживает низкое разрешение изображения;
  • Работает онлайн - установка на компьютер не требуется;
  • Позволяет загружать до 5 картинок;
  • Автоматическая настройка изображения для лучших результатов;
  • Распознает картинки размером до 5Мб.

Единственный недостаток, который я заметил – на выходе можно получить только файл txt. Но и этого вполне хватает.

 

i2OCR

 

I2OCR – бесплатный сервис, где можно быстро и без проблем распознать текст с изображения (если на ней есть текст) и сохранить в формате текстового файла. Как и аналогичный сервис, этот прост в использовании.

Особенности сервис i2OCR:

  • Сервис предлагает распознание текста в неограниченном количестве;
  • Поддержка 60 языков (русский, английский и другие);
  • Поддержка всех основных форматов изображений (входные файлы): JPG, PNG, BMP, TIFF и т.д.;
  • На выходе получаете документ в формате: Microsoft Word, Adobe PDF;
  • Поддержка многоколоночных текстов;
  • Есть возможность загружать изображения из URL, облачных сервисов и жесткого диска;
  • Можно продолжить работу в Google Docs, а также переместить текст в онлайн переводчики Google или Bing;
  • Конфиденциальность данных пользователей.

Есть ограничения: входные файлы не больше 10 Мб и не распознает почерк (только машинописный текст).

 

ONLINEOCR.NET

 

ONLINEOCR.NET – мощный и многофункциональный сервис OCR (Optical Character Recognition, то есть оптического распознавания символов), благодаря которому можно быстро распознать текст с картинки, PDF-файлов и многих других форматов. Возможности сервиса хорошие, но в пределах разумного – файл должен быть с разрешением, с которого можно будет произвести распознание. Сервис поддерживает 46 языков, в том числе русский, украинский.

Преобразованные документы выглядят в точности как оригинал - таблицы, столбцы и графики. OnlineOCR.net это бесплатный сервис распознавания текста в «гостевой режим» (без регистрации), что позволяет преобразовывать 15 изображений в час. Регистрация даст вам возможность конвертировать многостраничные PDF-документы и другие форматы.

Поддержка входных файлов (не больше 5 Мб) в формате PDF и изображений (JPG, BMP, TIFF, GIF) и выходные распознаются и преобразуются в Word, Excel и другие текстовые форматы. Для того, чтобы начать процесс распознания текста с изображения или PDF-файла, нужно проделать 3 шага:

  1. загрузить файл, нажав на кнопку Select file;
  2. выбрать язык, указать выходной файл (например, DOCX);
  3. нажать на кнопку Convert.

После можно отредактировать полученный текст прямо в окне браузера или сохранить себе на компьютер.

 

OCRONLINE

 

OCRONLINE – онлайн сервис, который позволяет распознать текст с картинки (разрешения JPG, TIFF, PNG, GIF), а также PDF-файлов. Сервис поддерживает высокую точность распознавания текста на нескольких языках, и многостраничные документы сложной верстки. OCROnline имеет улучшенный многоязычную поддержку и возможность обработки документов на 153 языках мира. И при всем этом сервис бесплатный. На выходе можно получить файлы в формате TXT,DOC, RTF или PDF, что очень даже не плохо.

Есть и ограничения:

  • Обязательная регистрация в сервисе (займет не более 1 минуты);
  • Каждый пользователь получает 5 страниц бесплатно при регистрации. Но каждый понедельник лимит обнуляется и опять в запасе 5 страниц;
  • Размер файла не более 10 Мб;
  • Файлы хранятся 24 часа, после чего удаляются (так что после распознания, сразу скачивайте на свой компьютер).

Для того чтобы преобразовать картинку в текст, необходимо для начала зарегистрироваться. После получаем доступ к аккаунту сервиса OCROnline и начинаем выполнять следующие действия:

  1. Выбор языка;
  2. Формат исходного файла;
  3. Загружаем файлы (картинки или PDF-файл), нажав на кнопку Browse и Upload;
  4. Кликаем по ссылке PROCESS;
  5. Получаем ссылку для скачивания файла.

Могу отметить, что для бесплатного сервиса очень неплохо распознает текст, так что пользуйтесь.

 

NEWOCR.COM

 

NEWOCR.COM - это бесплатный онлайн сервис OCR (оптического распознавания символов), может анализировать текст в любом файле изображения, которое вы загружаете, и затем конвертировать картинку в текст, который можно легко редактировать на вашем компьютере.

Особенности:

  • Неограниченная загрузка файлов;
  • Регистрация не требуется;
  • Сохраняет данные в безопасности (все загруженные пользователем файлы удаляются с сервера);
  • Поддержка до 75 языков и шрифтов;
  • Поддержка многоколоночный документ;
  • Картинки можно вращать: по часовой стрелке/против часовой стрелки на 90°, 180°;
  • Различные варианты отображения и обработки полученного текста
  • Можно продолжать редактирование документа в Google Docs
  • Перевод с помощью Google Translate или Bing Translator
  • Копировать в буфер обмена
  • Поддерживает плохо отсканированных и сфотографированных документов;
  • Поддерживает изображения с низким разрешением.

Входные форматы файлов:

  • Изображения: JPEG, JFIF, PNG, GIF, BMP, PBM, PGM, PPM, PCX;
  • Сжатые файлы: Unix compress, bzip2, bzip, gzip;
  • Многостраничных документов: TIFF, PDF, DjVu;
  • Документы:DOCX, ODT файлов с изображениями;
  • Несколько изображений в ZIP-архиве;

Форматы выходных файлов

  • Обычный текст (TXT);
  • Microsoft Word (DOC);
  • Adobe Acrobat (PDF);

Для того, чтобы распознать текст с картинки: загружаем файл (кнопка Обзор) или указывает ссылку на него (File URL). После этого нажимаем на кнопку Preview. На Следующей странице добавляем язык (по умолчанию стоит русский и английский), указываем поворот входного файла (картинки), если в тексте есть колонки, то ставим галочку (Page layout analysis - split multi-column text into columns) и нажимаем на кнопку OCR. По окончанию получаем распознанный текст, который можно скачать, нажав на кнопкуDownload.

 

FREE-OCR.COM

 

FREE-OCR.COM - это бесплатный онлайн инструмент для распознания текста с изображений и других файлов. Этот сервис можно использовать этот сервис для извлечения текста из любого изображения, которые вы загрузите. Услуга сервиса Free-OCR.com предоставляется бесплатно, регистрация не требуется. Просто загрузите файлы изображений. Free-OCR принимает либо JPG, GIF, TIFF, BMP или PDF (только первую страницу).

Единственным ограничением является то, что изображения должны быть не более 2 Мб, не шире или выше, чем 5000 px и существует ограничение 10 изображений в час. Free-OCR может обрабатывать изображения с несколькими столбцами текста, а также поддерживает 29 языков.

Для преобразования файла, потребуется выбрать данный файл, исходный язык, ввести капчу и нажать на кнопку Send file. После получаем в окне браузера распознанный текст. Тут, к сожалению нельзя скачать в виде документа Word.

 

FINEREADER ONLINE

 

FINEREADER ONLINE – это классический вариант распознания текста с картинки или PDF файла. Данный сервис является аналогом приложения FineReader под Windows. Так как программное обеспечение является платным, то и сам сервис не бесплатен, то есть имеет определенные ограничения. Но по своему функционалу, как мне показалось, превосходит все выше перечисленные онлайн сервисы.

FineReader Online позволяет распознать отсканированные документы в следующие форматы: JPEG, BMP, PNG, TIFF, PCX, DCX в исходные форматы документов Word, Excel, PowerPoint,  PDF, а также текстовые файлы – TXT. Поддержка 30 языков.

Есть недостатки:

  • Обязательная регистрация;
  • Документы хранятся 14 дней, после чего удаляются;
  • Бесплатная версия позволяет распознать всего лишь 10 страниц. Если хотите больше, то уже надо платить.

Для того чтобы распознать текст сервисом FineReader Online, нужно для начала зарегистрироваться (займет не более 1 минуты) и загрузить свой аккаунт, нажав по ссылке Распознание (в верхнем меню) или кнопку Распознать. Далее загрузится довольно удобный интерфейс, где все разбито по этапам:

  1. Загрузить файл для распознания;
  2. Выбрать язык документа (можно несколько, так как в файле может присутствовать не один язык в тексте);
  3. Выбрать формат документа;
  4. Распознать.

После завершения процесса распознания текста с файла, его остается скачать на свой компьютер.

Теперь подытожим, есть множество онлайн сервисом для распознания текста с картинки/изображения или других файлов. О некоторых из них, вы узнали сегодня и наверняка воспользовались, а другие закинули в закладки браузера. Говорить, что один сервис лучше другого не стану, лучше вам сравнить и выбрать для себя наилучший и оптимальный вариант. Все вышеперечисленные сервисы не являются профессиональным веб-приложениями в сфере сканирования и распознания текстов, а всего лишь палочки-выручалочки в трудных ситуациях, когда нужно быстро получить текст с небольшого документа.

источник

Рубрики:  Работа с компьютером
Метки:  

Процитировано 1 раз