Ви є тут

Система поиска текстовых документов на основе автоматически формируемого электронного каталога

Автор: 
Борисюк Федор Владимирович
Тип роботи: 
кандидатская
Рік: 
2010
Кількість сторінок: 
120
Артикул:
188947
179 грн
Додати в кошик

Вміст

Введение.
Глава I. Общая характеристика проблемы тематического ранжирования, на основе автоматически построенного электронного каталога текстовых документов.
1.1 Предлагаемая математическая модель поиска по ключевым словам с тематическим ранжированием.
1.2 Предлагаемая математическая модель автоматического построения электронного каталога
1.3 Постановка задачи текстовой кластеризации
1.4 Обзор существующих алгоритмов текстовой кластеризации
1.4.1 Алгоритмы кластеризации, использующие критерий квадратичной ошибки.
1.4.2 Алгоритмы основанные на технологии нейронных сетей.
1.4.3 Алгоритмы кластеризации, основанные на концепции плотности
1.4.4 Алгоритмы, основанные на теории графов.
1.4.5 Иерархические алгоритмы, строящие бинарное дерево
1.4.6 Алгоритм кластеризации основанный на суффиксном дереве.
1.4.7 Методы нечеткой кластеризации
1.5 Оценка качества кластеризации текстовой коллекции
1.6 Оценка качества ранжирования поисковых результатов.
1.7 Постановка задачи формирования информационных образов текстовых документов.
1.8 Морфологический анализ.
1.9 Обзор методов статического анализа формирования информационных образов документов.
1.9.1 Критерий порога частоты встречаемости слова в документах коллекции
1.9.2 Критерий информационного веса слова в рубрике.
1.9.3 Критерий прироста информации
1. Оценка важности терминов по формуле ТТГОР
Выводы по главе 1
Глава II Разработка математической модели поиска по ключевым словам с тематическим ранжированием на основании автоматического построения электронного каталога текстовых документов.
2.1 Подготовка информационных образов текстовых документов.
2.2 Построение инвертированного индекса
2.3 Иерархическая кластеризация по областям текстовых документов
2.3.1 Инициализация алгоритма иерархической кластеризации по областям.
2.3.2 Этап обработки входящего потока документов
2.3.3 Критерий качества уровня дерева.
2.3.4 Операция разделения области.
2.3.5 Операция интеграции подобластей.
2.3.6 Анализ вычислительной сложности алгоритма иерархической кластеризации по областям
2.4 Преобразование иерархии кластеров в иерархию электронного каталога
2.5 Построение вербального описания иерархического каталога.
2.6 Описание выбранной технологии распределенного программирования .i.i
2.7 Параллельная реализация построения информационных образов текстовых документов
2.8 Параллельная реализация алгоритма иерархической кластеризации по областям текстовых документов.
2.9 Поиск по ключевым словам с тематическим ранжированием, на основе электронного каталога.
Выводы по главе II
Глава III. Программная реализация системы поиска с тематическим
ранжированием, на основе автоматически построенного электронного каталога
3.1 Структура программного комплекса поисковой системы с тематическим
ранжированием, на основе автоматически построенного электронного каталога
3.1.1 Компонент построения иерархической структуры каталога.
3.1.2 Компонент построения образов текстовых документов.
3.1.3 Компонент поиска с тематическим ранжированием результатов
3.1.4 Компонент алгори тмов параллельного построения электронного каталога
3.2 Описание тестовых текстовых коллекций.
3.3 Выбор параметров алгоритма иерархической кластеризации по областям
3.4 Результаты испытаний предлагаемой математической модели автоматического построения электронного каталога
3.4.1 Результаты испытаний последовательных версий разработанных алгоритмов.
3.4.2 Исследование предлагаемого способа формирования описания кластеров
3.4.3 Результаты испытаний параллельных версий разработанных алгоритмов.
3.5 Результаты испытаний качества работы предлагаемого алгоритма тематического ранжирования.
Выводы по главе III
Выводы.
Список литературы