В пену

Искусственный интеллект оказался неразрешимой задачей

forbes.ru — Математики доказали, что алгоритмы машинного обучения упираются в проблему теории множеств, не имеющую решения по фундаментальным причинам

Новости, Наука | Ворчун 15:11 15.01.2019

2 комментария | 88 за, 3 против |

Zeromum »

#1 | 16:03 15.01.2019 | Кому: Всем

Среди меня ходит мнение, что любой сегодняшний ИИ это просто хорошо отлаженный if-then.

Zeromum »

#2 | 21:41 15.01.2019 | Кому: Mellcorn

> Предлагаю просто представить, сколько потребуется написать if then что бы отличить кошку от собаки в изображении. Учтите что компьютер не видит носов или ушей. Видит только числа координат пикселей и 3 числа rgb определяющих цвет.

Мне легко представить это, так как я немного знаком с материей.
Упомянутые "коодинаты пикселей и 3 числа RGB" использует например старый громоздкий формат .BMP.

А в матрице фото и видеокамеры мало того что каждый пиксель состоит из нескольких разных по цвету, количеству и качеству фотосенсоров, так и считывается он по-разному.
Обычно построчно в небольшой пуфер, и оттуда сразу в кодирующий алгоритм, обычно не дожидаясь остатка картинки, для скорости.

И уже тут начинается интересное: каждую группу пикселей прогоняют через трансформацию Фурье и на выходе получают каждый раз начальное значение и матрицу "частот".
Кстати, чем выше "частота", тем скорее её можно обнулить, "упростив" картинку. а после упрощения в определённом высокочастотном месте матрицы поставить "единичку" (для глаза будет незаметно), а в том же месте уже следующей группы пикселей, поставить "ноль". И посвящённый человек, знающий на какой бит в файле смотреть, псможет прочитать "10" - получается потайное письмо. Но это чисто как побочный эффект. КС
Так вот у нас получается картинка в виде матриц. Если хотим анализировать картинку в целом, и "найти кошку", берём только начальные значения (остальное можно приберечь на потом). И снова прогоняем через Фурье.
Получаем начальное значение фона, и матрицу частот, диапазон задаем мы: чем шире, тем точнее.
И так анализируем миллион картинок с кошками, и ищем сходство матриц. Не вся матрица должна сойтись, а лишь участок, этого достаточно.
И это будет чисто математика (Фурье, Матрицы, поиск минимума и проч.) и немного компьютерной логики.

Второй или дополнительный метод анализа: найти границы цветовых пятен.
Ищем максимумы разниц значений между соседними ячейками/пикселями, желательно взаимосвязанные и замкнутые в кольцо.
Записываем местоположение контура на картинке. Опять делаем матрицу из координат контуров.
Записываем все пиксели замкнутого контура в пуфер, анализируем по методу 1. Записываем результат вместе с координатами.
Анализируем следующие контуры аналогично.

Анализируем миллион картинок с кошками и ищем похожие контуры (кореллирующие матрицы) и особенно их кореллирующие координаты.
Опять же всё математика и миллионы вычислений.
Да, алгоритмы и методы постоянно совершенствуются, распространяются готовыми пакетами - frameworks, и базируются на знаниях и работах предыдущих поколений программистов,
да, они часто бьют "в яблочко". Но это - не ИИ.

Это, конечно, "на коленке" объяснено. Но приглядись к результатам поиска по похожей картинке - это именно они.
Похожий метод используется и в распознавании речи и музыки.

Но, как говорится, по жизни я не филолог и лишь немного ракетчик.

Войдите или зарегистрируйтесь чтобы писать комментарии.

Логин
Пароль
	Запомнить