Ви є тут

Аналіз одновимірних та двовимірних діагностичних даних методами штучних нейронних мереж

Автор: 
Мисник Анатолій Васильович
Тип роботи: 
Дис. канд. наук
Рік: 
2005
Артикул:
3405U000491
129 грн
Додати в кошик

Вміст

РОЗДІЛ 2
ПОБУДОВА САМООРГАНІЗУЮЧОЇ МЕРЕЖІ
Вступ
Існує декілька основних вимог згідно яких обираються алгоритми для
різноманітних завдань медичної практики [8]. По-перше, якщо потрібна
класифікація за деякими параметрами, а не за самим зображенням, обираються
алгоритми невеликих за розміром мереж, які не потребують багато ресурсів
обчислювальної техніки, тобто щоб програми не використовували надмірно потужної
техніки. Бажано також, щоб алгоритм використовував самоорганізацію, бо зараз
існують тільки емпіричні методи вибору кількості вузлів та порогових значень.
По-друге, вимагається, щоб алгоритм був збіжним і похибка при цьому повинна
бути якомога малою. По-третє, необхідно, щоб існував метод декодування та
інтерпретації отриманої від нейронної мережі інформації.
Найчастіше в медицині використовуються декілька класичних алгоритмів, таких як
персептрон, багатошаровий персептрон, алгоритм Кохонена, а також модифіковані
варіанти алгоритму прямого розвитку, або їх різноманітні версії.
2.1. Класифікація та розпізнавання за допомогою нейронних мереж
Будь-яке завдання для нейронних мереж можна звести до трьох основних випадків:
проведення класифікації, розпізнавання даних та об’єктів та відновлення
функціональної залежності. Перші два випадки найбільш часто виникають під час
біофізичних досліджень, наприклад, під час обробки даних з метою встановлення
діагнозу, проведення експертних оцінок розпізнавання та сегментації медичних
зображень, обробці та фільтрації біофізичних даних. Третій випадок —
встановлення, або відновлення функції виникає як в чистому вигляді для
вирішення деяких задач моделювання, так і під час розпізнавання або відновлення
зображень.
Найбільш загальнім раніше був теоретичний опис, або формалізм з використанням
термінології фазової поведінки системи. Але, нажаль, такий опис є досить
обмеженим і не має реальної аналогії, як фазовий підхід в теоретичної механіці
та теорії коливань, тому найбільш вдалим є розгляд на основі гіперпростору
вихідних рішень. Загальна проблема, яка є предметом уваги вивчення за допомогою
технологій нейронних мереж, — це автоматизована побудова гіпотез і тверджень,
які враховують спостережувані дані про деякі об`єкти, або класи об`єктів [9].
Найбільшу вагу при цьому має випадок, коли проблема формулюється наступним
чином: гіпотези і твердження, які потребують вивчення, відносяться до
кластеризації або відображення певної сукупності об`єктів в скінчену множину
об’єктних класів. Таким чином спостережувані дані визначають множину прикладів
сукупностей об’єктів, на базисі яких будується представлення кластеризації.
Об`єкти можуть бути спостережені або описані за допомогою їх описів
(дескрипторів) в термінах сукупності властивостей або атрибутів. З такої точки
зору, об`єкти деякого набору можна представити відповідними векторами, де
кожний компонент вектору визначає значення певного атрибута об`єкта. Таким
чином, простір об`єктів — це n-мірний простір векторів V [9]. Спостережувані
дані про набір об’єктів — це відображення M простору векторів V в скінчену (а
тому і дискретну) множину елементів Z={z1, z2, … , zm}. Отримуючи таке
відображення:
M: VZ, (2.1)
можна визначити співвідношення належності q для множини V слідуючим чином:
маючи два визначених об`єкта - X та Y (елементів V), ми відноситимемо X до Y в
тому і тільки в тому випадку, якщо
M(X)=M(Y). (2.2)
Співвідношення належності t визначає розділення об`єктів (елементів V) в
множину об`єктних класів Сi, де i=1,2, ... m.
Більшість завдань з класифікації об`єктів або адаптивної фільтрації можуть бути
сформульовані так, як вказано вище. Найбільш важливими серед таких завдань є
створення моделі системи, яка автоматично відтворює відображення М зі
спостереження Ме яка є підмножиною М (2.1). Якщо відображення визначає об`єктні
класи, тобто навпаки, мета створення системи залишається тією ж самою —
створення системи, яка автоматично відновлює представлення (вивчені
дескриптори) для класів об`єктів зі спостереження Ме, де Ме — множина
класифікованих векторів-прикладів.
Індукція повного опису системи з її функції відображення за допомогою
фрагментарних даних (спостережуваних знань) є процесом узагальнення. Далі ми
визначимо узагальнення Ме для довільної множини V і відображення M (2.1), якому
також відповідає Ме, таким чином, що M(X)=Ме(X), або Ме(X) не є визначеним.
Зауважимо, що Ме: Vе Z і .
Таке узагальнення однозначно визначає розділення вхідного простору в об`єктні
класи [11]. Вказаний вище процес узагальнення можна звести до специфікації
класів об`єктів зі спостережуваної інформації про об`єкти за допомогою
об`єктів-представників кожного класу. Однак за допомогою декількох
представників класу неможливо впевнено визначити, які атрибути дають можливість
описати клас. Можна тільки визначити найпростіші параметри-дескриптори класу,
які підходять для узагальнення. Досить багато відображень можуть бути сумісними
з Ме, але не всі вони відповідають процесу узагальнення. Тому завдання методик
навчання полягає в тому, щоб знайти загальні характеристики деякої функції, яка
відповідає узагальненню відображення і дає добрі результати для тих векторів
множини V, які не належать до підмножини Vе.
Найбільш часто для опису систем приймається формалізм, який описує всі можливі,
або ті що можуть бути передбачені, випадки. Згідно з таким формалізмом, всі
об`єктні класи, які асоційовані з відображенням М, описуються в стандартній
формі, а тому і відображення М є неявно описаним. Базисний елемент такого
формалізму — гіперплощини у вихідному просторі, які розділяють вектори вхідних