Почему ИИ не может рисовать руки: мнение эксперта

Александр Краковецкий, руководитель компании DevRain, имеет более 20-летний опыт в сфере искусственного интеллекта. Недавно он принял участие в проекте «Спроси меня» на YouTube-канале AIN, где ответил на популярные вопросы из интернета о ИИ.

Об этом сообщает ProIT

Почему искусственный интеллект не умеет рисовать руки?

Одной из главных проблем, с которой сталкиваются большие языковые модели и другие инструменты ИИ, является неспособность генерировать изображения рук. Эта ситуация объясняется не только проблемами с рисованием рук, но и трудностями в воспроизведении других анатомических элементов, таких как глаза и уши. В основе этой проблемы лежит недостаточное количество примеров в наборах данных, на которых обучались модели. В результате LLM (большие языковые модели) не могут должным образом генерировать эти части тела.

LLM создают изображения поксельно, не имея понимания анатомии и физики тела. Поэтому многие разработчики начали уделять больше внимания улучшению наборов данных, касающихся анатомических особенностей человека. Учитывая это, последние версии LLM демонстрируют значительный прогресс в генерации изображений.

Становится ли тест Тьюринга устаревшим?

Тест Тьюринга, который заключается в определении, общается ли человек с роботом или с живым существом, был успешно пройден еще в 60-х годах. Однако с приходом больших языковых моделей он постепенно уходит на второй план. В настоящее время для оценки прогресса таких моделей используются различные бенчмарки, и тест Тьюринга уже не является основным критерием.

«Тест Тьюринга уже становится устаревшим, но именно с него начался искусственный интеллект».

Искусственный интеллект может быть предвзятым из-за различных факторов, первым из которых является набор данных. Если данные содержат предвзятости, то модель, обученная на них, также будет предвзята. Однако это не единственный этап. Предвзятости могут возникать во время дополнительного обучения, когда люди оценивают работу ИИ и влияют на процесс своими предвзятостями. Возможны также организационные предвзятости, когда компании устанавливают ограничения и модерацию.

Это явление можно наблюдать на примере компании DeepSeek, где над большой языковой моделью был наложен определенный слой цензуры, что также свидетельствует о предвзятости.

Дополнительные вопросы, такие как возможность замены психолога искусственным интеллектом и перспективы восстания машин, также вызывают обсуждения среди специалистов в этой области.