Китайският технологичен гигант Alibaba представи обновена версия на своя модел за изкуствен интелект (AI) Qwen 2.5, като твърди, че той надминава високо оценения DeepSeek-V3.
Интересното е, че Qwen 2.5-Max беше пуснат именно на първия ден от Лунната нова година, когато повечето хора в Китай прекарват времето си със семействата си, а не на работа. Този ход подчертава силния конкурентен натиск, който бързото издигане на DeepSeek оказва както върху международните, така и върху местните съперници през последните няколко седмици.
Според облачното подразделение на Alibaba, Qwen 2.5-Max се представя по-добре от GPT-4o, DeepSeek-V3 и Llama-3.1-405B, които са сред най-развитите AI модели с отворен код, създадени от OpenAI и Meta.
Революционното представяне на DeepSeek-V3 на 10 януари, последвано от пускането на модела R1 на 20 януари, предизвика шок в Силициевата долина и доведе до спад на акциите на технологичните компании. Предполагаемите ниски разходи за разработка и поддръжка на китайския AI стартъп породиха съмнения сред инвеститорите относно оправдаността на мащабните финансови вложения в сектора от водещите американски компании.
Бързият възход на DeepSeek не остана без отговор – китайските AI компании започнаха надпревара за подобряване на собствените си технологии.
Само два дни след представянето на DeepSeek-R1, компанията ByteDance, която притежава TikTok, актуализира своя водещ модел за изкуствен интелект. Според наличните данни той е изпреварил OpenAI o1, подкрепян от Microsoft, в AIME – тест, оценяващ способността на AI моделите да разбират и изпълняват сложни инструкции.
Сходни твърдения направи и DeepSeek, като обяви, че моделът R1 е равностоен на OpenAI o1 по редица ключови показатели за производителност.