DeepSeek представила самую мощную модель искусственного интеллекта с открытым исходным кодом
Китайский стартап DeepSeek представил предварительные версии новой флагманской модели искусственного интеллекта V4, которую называет самой мощной среди решений с открытым исходным кодом.
Об этом сообщила компания.
Новая модель имеет две версии — V4 Flash и V4 Pro. Базовая Flash содержит 284 млрд параметров (из них 13 млрд активных), тогда как продвинутая Pro — 1,6 трлн параметров (49 млрд активных).
В DeepSeek заявляют, что версия Pro по производительности приближается к ведущим мировым моделям с закрытым кодом, но при этом имеет значительно более низкую стоимость использования.
Модель построена на архитектуре гибридного внимания, что улучшает работу с длинными диалогами и позволяет обрабатывать большие объемы информации. В частности, она поддерживает контекст до 1 млн токенов, что позволяет работать с большими документами или кодовыми базами.
Компания отмечает, что в настоящее время вычислительные ресурсы для полноценного использования V4 Pro ограничены, однако ожидает удешевления после запуска новых кластеров на чипах Huawei во второй половине года.
На фоне этой новости акции китайских производителей микрочипов выросли, тогда как бумаги конкурентов продемонстрировали падение.
DeepSeek также ведет переговоры о привлечении инвестиций от крупных технологических компаний в рамках своего первого раунда инвестиций.
Кроме того, мы писали, что искусственный интеллект иногда лжет, даже зная правду.
Китайская компания DeepSeek планирует запустить новую модель искусственного интеллекта V4 на чипах Huawei Technologies в ближайшие недели — это важный шаг в контексте технологического развития Китая и ограничений на поставки иностранных процессоров.