Программа: Оптико-электронные приборы и системы


Характеристики бинокулярного зрения



страница7/12
Дата29.04.2018
Размер0.78 Mb.
ТипПрограмма
1   2   3   4   5   6   7   8   9   ...   12

2.3. Характеристики бинокулярного зрения


Основными характеристиками бинокулярного зрения являются наличие элементарного бинокулярного, глубинного и стереоскопического зрения, острота стереозрения и фузионные резервы

Наличие элементарного бинокулярного зрения проверяется посредством разбиения некоторого изображения на фрагменты, часть которых предъявляется левому, а часть – правому глазу. Наблюдатель обладает элементарным бинокулярным зрением, если он способен составить из фрагментов единое исходное изображение.

Наличие глубинного зрения проверяется путем предъявления силуэтных, а стереоскопического – случайно-точечных стереограмм, которые должны вызывать у наблюдателя специфическое переживание глубины, отличающееся от впечатления пространственности, основанного на монокулярных признаках.

Острота стереозрения – это величина, обратная порогу стереоскопического восприятия. Порог стереоскопического восприятия – это минимальная обнаруживаемая диспаратность (угловое смещение) между частями стереограммы. Для его измерения используется принцип, который заключается в следующем. Три пары фигур предъявляются раздельно левому и правому глазу наблюдателя. В одной из пар положение фигур совпадает, в двух других одна из фигур смещена по горизонтали на определенное расстояние. Испытуемого просят указать фигуры, расположенные в порядке возрастания относительного расстояния. Если фигуры указаны в правильной последовательности, то уровень теста увеличивается (диспаратность уменьшается), если нет – диспаратность увеличивается.

Фузионные резервы – условия, при которых существует возможность моторной фузии стереограммы. Фузионные резервы определяются максимальной диспаратностью между частями стереограммы, при которых она еще воспринимается в качестве объемного изображения. Для измерения фузионных резервов используется принцип, обратный применяемому при исследовании остроты стереозрения. Например, испытуемого просят соединить (сфузировать) в одно изображение две вертикальных полосы, одна из которых видна левому, а другая – правому глазу. Экспериментатор при этом начинает медленно разводить полосы сначала при конвергентной, а затем при дивергентной диспаратности. Изображение начинает «разваливаться» при значении диспаратности, характеризующей фузионный резерв наблюдателя.

2.4. Модели бинокулярного зрения.

Модели позволяют связать разнородную информацию, полученную с помощью разнообразных методик изучения различных уровней системы бинокулярного зрения. Возможна классификация моделей по следующим основаниям: вид моделируемого явления (онтогенез зрительной коры, структура РП нейрона, взаимодействие бинокулярных каналов, собственно восприятие глубины); вход модели (изображения, ответы нейронов предыдущих уровней зрительного анализатора, первичная карта диспаратностей); структура модели (число пространственно-частотных каналов, имитируемые типы бинокулярных нейронов и их РП, операции, осуществляемые модельными нейронами); граничные условия работы модели; выход модели (распределение бинокулярных нейронов различных типов, ответы бинокулярных нейронов, карта диспаратностей).

Одной из важных проблем при моделировании является определение степени адекватности модели. В настоящее время отсутствует универсальная модель, способная объяснить большую часть разрозненных физиологических, морфологических и психофизиологических данных, поэтому для любой современной модели стереозрения всегда существует «контрпример», лежащий за пределами ее возможностей. Это приводит к тому, что модели редко используются для обоснования выбора тестового набора изображений, методики эксперимента, обработки результатов и т.д. Тем не менее, необходимо и создание моделей процессов, протекающих в зрительном анализаторе, и разработка способов их тестирования.

Способы тестирования модели зависят от типа моделируемого явления.

Из описания алгоритма создания СТС достаточно очевидно, что для составления карты диспаратностей необходимо находить корреляцию между участками левого и правого изображения. Однако в понятие «корреляция» может вкладываться различный смысл. То есть корреляция может описываться с помощью различных алгебраических операций, вычисляться для различных по размеру и форме регионов стереограммы.

Массив проблем, связанных с исследованиями стереозрения, проще понять, обратившись к классическим моделям выделения глубины.

В основе первой, элементарной, модели, лежали два утверждения:


  1. Всякая связанная область точек может быть воспринята как обладающая глубиной независимо от формы ее границ.

  2. Для определения локального соответствия между точками левого и правого изображений должна использоваться некая операция «@». То есть мерой локального соответствия является , где x и y – координаты точек, принадлежащих левому (L) и правому (R) изображениям, k - диспаратность.

Показано, что операцией «@» может быть вычитание или деление, но не умножение или сложение. В этом случае ответы модельных нейронов Dk сопоставимы с ответами нейронов V1.

Для построения начальной карты диспаратностей, состоящей из k слоев, выбрана операция вычитания: . Затем с картой диспаратностей итеративно проводятся несколько этапов фильтрации.

Достоинства модели - возможность обработки полутоновых СТС, естественных изображений, достаточно разреженных СТС.

Основной недостаток – невозможность исследования эффектов взаимодействия областей с различной диспаратностью (так как карта диспаратностей изначально состоит из непересекающихся слоев). Поэтому была предложена иная, пружинно-дипольная, модель, суть которой заключается в следующем.

Введем в рассмотрение плоскость, содержащую большой массив тонких магнитных диполей (стрелок компаса), насаженных на шпеньки по центру так, что стрелки могут вращаться в любом направлении. Будем считать эту плоскость «кортикальной картой поля зрения», в которой диполи соответствуют бинокулярным нейронам. Стимуляция сетчатки белыми и черными точками эквивалентна ориентированию южных и северных полюсов магнитных диполей соответственно в направлении «от наблюдателя» и «к наблюдателю». После того, как магнитные диполи переймут паттерн части стереограммы, концы стрелок соседних диполей соединяются двумя пружинками. Диполи связываются с соседями как слева, так и справа, как сверху, так и снизу. Сила пружин, соединяющих соседей по горизонтали, больше, чем сила пружин, соединяющих соседей по вертикали. Таким же способом упорядочен другой массив диполей при стимуляции второй сетчатки.

Если части стереограммы идентичны, то после совмещения плоскостей, на которых расположены диполи, северный и южный полюса соответствующих диполей притянутся друг к другу. Хотя диполи могут поворачиваться на любой угол, только горизонтальная составляющая поворота отвечает восприятию глубины. Для идентичных паттернов после краткого переходного процесса все соответственные диполи притянутся, и суммарная сила притяжения между массивами будет очень высока. Притяжение двух диполей соответствует локальной фузии, а притяжение области диполей – глобальной фузии. Максимальный угол поворота отвечает пределу локальной свободной фузии. Отталкивание двух диполей друг от друга отвечает локальной бинокулярной конкуренции.

Недостатком этой модели является ее аналоговый характер, что привело к тому, что она не была реализована. По-видимому, модель позволяет объяснить многие психофизиологические явления, однако с ней возможно проводить только мысленные эксперименты, что не позволяет выявить ее степень адекватности.

Для получения начальной карты диспаратностей в классическом кооперативном алгоритме нахождения областей равной диспаратности выбрана операция умножения.



, где Сxyd – ответ нейрона с координатами x, y слоя d карты диспаратностей, 0 – номер итерации. Ответы модельных нейронов Сxyd сопоставимы с ответами нейронов V1.

В ходе работы алгоритма нейроны, РП которых находятся в одной точке изображения, обладающие различной диспаратностью, конкурируют друг с другом. Максимальный ответ остается у нейрона, соседи которого предпочитают такую же диспаратность.

Алгоритм обладает следующими особенностями:


  1. Могут быть решены СТС с плотностью менее 10%, причем скорость сходимости уменьшается с уменьшением плотности.

  2. Алгоритм заполняет пустые области для разреженных СТС.

  3. Ширина минимальной декодируемой области растет с ростом диспаратности.

Алгоритм сходится достаточно быстро для «хороших» СТС. Приведены [5] результаты обработки лишь черно-белых СТС (0 – черный, 1 - белый). Поэтому вопрос о правомерности выбора операции умножения для вычисления С(0) остается открытым.

Роль движений глаз при фузии до сих пор неясна. Тем не менее существуют простые неитеративные алгоритмы, позволяющие описывать процесс позиционирования модельных сетчаток на частях стереограммы. В их основе лежат функционалы, называемые потенциалами вергентности (ПВ).

Один из «простых» ПВ , где L и R – сегменты изображений, u и v – координаты точек внутри сегментов, s – диспаратность, || || - подходящая мера схожести. V(s) имеет экстремум для такого s, при котором максимально число точек сегментов с диспаратностью s. Существует и более «сложные» ПВ, имеющие более глубокие экстремумы.

Функционал, подобный V,  служит для выделения глобальных планов глубины из СТС. U(s) рассчитывается на TI нейронах, суммарная активность которых используется для управления TE нейронами и формирования движений глаз.

Проблема при использовании ПВ заключается в подборе размера «окна» - сегмента, для которого рассчитывается потенциа. Так, в для фильтрации слоя карты диспаратностей использовался ПВ, рассчитываемый по всему изображению, кроме областей, исключенных из рассмотрения на предыдущих итерациях.

В настоящее время алгоритмы выделения глубины развиваются в сторону увеличения вычислительной сложности и более тщательного моделирования РП бинокулярных нейронов. Существуют модели, способные «фузировать» изображения различного контраста и объясняющие явления «притягивания» и «отталкивания» диспаратностей. Причем результирующая карта диспаратностей строится не для пар точек, а для некоторых областей изображения.

Разработаны аналитические модели, воспроизводящие двумерную структуру РП бинокулярного нейрона с помощью гауссианов. Однако эти модели строятся скорее исходя из требуемого результата, чем на основе физиологических данных. Например, некоторые схемы требуют наличия в V1 одинакового числа TI, TE, N и F нейронов. Однако показано, что нейроны составляют всего 8%, а N и F – 30% от общего числа бинокулярных нейронов.

Следует отметить некоторые общие недостатки существующих моделей уровня восприятия, построенных с учетом биологических данных:



  1. Не учитывается структура связей между бинокулярными нейронами мозга – модельные бинокулярные нейроны объединяются в «нейронную сеть» для реализации некоторых «условий установления соответствия» между частями стереограммы, которые задаются исследователем на основе априорного представления о требуемом результате.

  2. За счет увеличения вычислительной сложности теряется «биологическое правдоподобие» моделей. В них вводятся нелинейные операции или этапы фильтрации изображений, которые, по-видимому, не могут быть реализованы нейронами первичных слоев зрительной системы.




Каталог: Structure -> Universe -> ire -> electrical engineering -> structure -> lighttech -> Documents
Structure -> Операционная система, память, интерфейс
Structure -> География транспортного комплекса
Structure -> Учебное пособие для самостоятельного изучения и выполнения лабораторных работ (для студентов агроинженерных специальностей). Иркутск: Иргсха, 2006. 118 с ил
Structure -> Программа учебной дисциплины основы неврологии
Structure -> Ко дню освобождения Новошахтинска. Новошахтинск в годы Великой Отечественной войны
Documents -> Программа: Оптико-электронные приборы и системы


Поделитесь с Вашими друзьями:
1   2   3   4   5   6   7   8   9   ...   12


База данных защищена авторским правом ©vossta.ru 2019
обратиться к администрации

    Главная страница