>>>Работа! Продавайте контент на сайте Vinegret! Узнай как!<<< ||| >>>Хочешь иметь свою мобильную версию сайта в Play Market? Узнай как!<<<
Новый ИИ-генератор изображений в 8 раз быстрее, чем лучший инструмент от OpenAI, и может работать на дешёвых компьютерах.

Новый ИИ-генератор изображений в 8 раз быстрее, чем лучший инструмент от OpenAI, и может работать на дешёвых компьютерах.

1 мин


Новый инструмент искусственного интеллекта (ИИ) может генерировать изображения менее чем за 2 секунды — и для его работы не требуется дорогостоящее оборудование.

Южнокорейские учёные использовали специальную технику, называемую дистилляцией знаний, для сжатия размера модели генерации изображений с открытым исходным кодом (или общедоступной), известной как Stable Diffusion XL, которая имеет 2,56 миллиарда параметров, или переменных, которые ИИ использует для изучения во время обучения.

Новый ИИ-генератор изображений в 8 раз быстрее, чем лучший инструмент от OpenAI, и может работать на дешёвых компьютерах.
Инструмент может работать на недорогих графических процессорах (GPU) и требует для обработки запросов примерно 8 ГБ ОЗУ. Изображение: Electronics and Telecommunications Research Institute(ETRI)

Самая маленькая версия новой модели, известная как «KOALA», имеет всего 700 миллионов параметров, а это означает, что она достаточно компактна для быстрой работы без использования дорогостоящего и энергоёмкого оборудования.

Используемый ими метод — дистилляция знаний — переносит знания из большой модели в меньшую, в идеале, без ущерба для производительности. Преимущество модели меньшего размера состоит в том, что выполнение вычислений и получение ответа занимает меньше времени.

Инструмент может работать на недорогих графических процессорах (GPU) и требует примерно 8 ГБ оперативной памяти для обработки запросов — по сравнению с более крупными моделями, которым требуются высокопроизводительные промышленные графические процессоры.

Команда опубликовала свои выводы в статье 7 декабря 2023 года в базе данных препринтов arXiv. Они также сделали свою работу доступной через репозиторий искусственного интеллекта с открытым исходным кодом Hugging Face.

Исследовательский институт электроники и телекоммуникаций (ETRI), учреждение, создающее новые модели, создало 5 версий, включая 3 версии генератора изображений «KOALA», который генерирует изображения на основе ввода текста, и две версии «Ko-LLaVA» — которые могут отвечать на текстовые вопросы с помощью изображений или видео.

Стоит отметить, что во время тестирования «KOALA», он сгенерировал изображение на основе подсказки «изображение астронавта, читающего книгу под луной на Марсе» за 1,6 секунды. Согласно заявлению, DALL·E 2 от OpenAI сгенерировал изображение на основе того же запроса за 12,3 секунды, тогда как DALL·E 3 сделал это за 13,7 секунды.

Теперь учёные планируют интегрировать разработанную ими технологию в существующие сервисы создания изображений, образовательные услуги, производство контента и другие направления бизнеса.

Правописание уведомления вебмастера


Понравилось? Поделитесь с друзьями!

Комментарии

- комментариев

Включить уведомления Да Спасибо, не надо