Presentation is loading. Please wait.

Presentation is loading. Please wait.

Разработка алгоритмов распознавания текста

Similar presentations


Presentation on theme: "Разработка алгоритмов распознавания текста"— Presentation transcript:

1 Разработка алгоритмов распознавания текста
на основе клеточных автоматов Автор: Суясов Д. И. Руководитель: Шалыто А. А., д.т.н., профессор

2 Этапы распознавания текста: Фильтрация изображения.
Постановка задачи Этапы распознавания текста: Фильтрация изображения. Сегментация изображения текста на изображения символов. Выделение характеристик / признаков символов из их изображений. Классификация этих признаков. Задача: Исследование подзадач процесса распознавания текста и принципов их решения на основе клеточных автоматов. РАЗРАБОТКА АЛГОРИТМОВ РАСПОЗНАВАНИЯ ТЕКСТА НА ОСНОВЕ КЛЕТОЧНЫХ АВТОМАТОВ

3 {G, M, Z, N, f} Клеточные автоматы с метками
РАЗРАБОТКА АЛГОРИТМОВ РАСПОЗНАВАНИЯ ТЕКСТА НА ОСНОВЕ КЛЕТОЧНЫХ АВТОМАТОВ

4 Последовательности клеточных автоматов
• Логика системы основана на последовательностях клеточных автоматов. • Клеточные автоматы в последовательности содержат простой набор правил. • Последовательность может содержать дополнительную функциональность. • Последовательность позволяет индивидуально настраивать клеточные автоматы. РАЗРАБОТКА АЛГОРИТМОВ РАСПОЗНАВАНИЯ ТЕКСТА НА ОСНОВЕ КЛЕТОЧНЫХ АВТОМАТОВ

5 Алгоритмы фильтрации и сегментации
Фильтрация Сегментация 1. 1. 2. 2. 3. 1. Черные точки помечаются индексом. 2. Для каждой черной точки индекс переписывается на минимальный из соседних или самой точки. 1. Все точки переводятся в оттенки серого. 2. Темные точки перекрашиваются в черные. 3. Светлые точки перекрашиваются в белые. РАЗРАБОТКА АЛГОРИТМОВ РАСПОЗНАВАНИЯ ТЕКСТА НА ОСНОВЕ КЛЕТОЧНЫХ АВТОМАТОВ

6 Затухание волны (отсутствие фронта)
Принцип выделения признаков символов Затухание волны (отсутствие фронта) Точки пройденного пути Шлейф волны Фронт волны Встреча двух волн РАЗРАБОТКА АЛГОРИТМОВ РАСПОЗНАВАНИЯ ТЕКСТА НА ОСНОВЕ КЛЕТОЧНЫХ АВТОМАТОВ

7 Алгоритмы выделения признаков символов
Алгоритм №1 фиксирует концы и петли символа: • выбирается начальная точка; • запускается волна; • фиксируются точки концов символов; • фиксируются точки встречи составляющих волны. РАЗРАБОТКА АЛГОРИТМОВ РАСПОЗНАВАНИЯ ТЕКСТА НА ОСНОВЕ КЛЕТОЧНЫХ АВТОМАТОВ

8 Алгоритмы выделения признаков символов
Результаты выделения признаков первым алгоритмом: • выделенные признаки практически уникальны; • время работы алгоритма: 16 символов – 6 секунд; РАЗРАБОТКА АЛГОРИТМОВ РАСПОЗНАВАНИЯ ТЕКСТА НА ОСНОВЕ КЛЕТОЧНЫХ АВТОМАТОВ

9 Алгоритмы выделения признаков символов
Алгоритм №2 фиксирует концы, петли и пересечения: • выбирается начальная точка; • запускается волна; • во время фиксации концов и пересечений запускается волна-эхо; • фиксируются точки концов символов и встречи составляющих волны. РАЗРАБОТКА АЛГОРИТМОВ РАСПОЗНАВАНИЯ ТЕКСТА НА ОСНОВЕ КЛЕТОЧНЫХ АВТОМАТОВ

10 Алгоритмы выделения признаков символов
Результаты выделения признаков вторым алгоритмом: • выделенные признаки уникальны; • время работы алгоритма: 16 символов – 15 секунд; РАЗРАБОТКА АЛГОРИТМОВ РАСПОЗНАВАНИЯ ТЕКСТА НА ОСНОВЕ КЛЕТОЧНЫХ АВТОМАТОВ

11 Моделирующая программа
• Сознание клеточных автоматов и последовательностей. • Запуск автоматов в пошаговом и автоматическом режимах. • Обучение и распознавание текста на основе шаблонов. • Возможность добавления других модулей работы с клеточными автоматами. РАЗРАБОТКА АЛГОРИТМОВ РАСПОЗНАВАНИЯ ТЕКСТА НА ОСНОВЕ КЛЕТОЧНЫХ АВТОМАТОВ

12 Изображение слова «документирование», размеры: 236 х 30 6 4% 2 9% 1 0%
Таблица сравнения Тестовые данные Моделирующая программа Курсовая работа (на основе нейронных сетей) FineReader Время работы, с. Процент ошибок Изображение слова «документирование», размеры: 236 х 30 6 4% 2 9% 1 0% Изображение русского алфавита без букв «й», «ё» и «ы» 13 3% 4 11% Изображение русского текста (76 символов), размеры: 561 х 56 16 5 17% 3 1% Изображение страницы текста (742 символа) 83 12% 40 16% 7 2% РАЗРАБОТКА АЛГОРИТМОВ РАСПОЗНАВАНИЯ ТЕКСТА НА ОСНОВЕ КЛЕТОЧНЫХ АВТОМАТОВ

13 Исследован процесс распознавания текста.
Результаты Исследован процесс распознавания текста. Показана применимость теории клеточных автоматов в распознавании. Введено понятие клеточного автомата с метками и последовательности клеточных автоматов. Разработан алгоритм фильтрации и сегментации изображений на основе клеточных автоматов. Разработаны и исследованы алгоритмы выделения признаков символов. Создана моделирующая программа. Расширяется область применения клеточных автоматов. Для качественного распознавания необходимо комбинировать несколько разных методов. РАЗРАБОТКА АЛГОРИТМОВ РАСПОЗНАВАНИЯ ТЕКСТА НА ОСНОВЕ КЛЕТОЧНЫХ АВТОМАТОВ

14 Спасибо за внимание РАЗРАБОТКА АЛГОРИТМОВ РАСПОЗНАВАНИЯ ТЕКСТА НА ОСНОВЕ КЛЕТОЧНЫХ АВТОМАТОВ


Download ppt "Разработка алгоритмов распознавания текста"

Similar presentations


Ads by Google