🚀 Хочешь улететь на Луну вместе с нами? Подписывайся на CryptoMoon! 💸 Новости крипты, аналитика и прогнозы, которые дадут твоему кошельку ракетный ускоритель! 📈 Нажмите здесь: 👇
CryptoMoon Telegram
阿里巴巴最近推出了一个新的高级推理模型,似乎DeepSeek和OpenAI可能要面临一些竞争-如果阿里巴巴的声明是准确的。这个模型是开源的,所以我自己看过它,你也可以免费做同样的事情。但是请记住,有些话题它不会在对话中讨论
Модель, недавно названная QwQ-32b (сокращение от Quan with Questions), работает со значительно меньшим количеством параметров, что означает использование меньшего количества ресурсов. Alibaba утверждает, что она обеспечивает такой же уровень производительности, как DeepSeek или o1-mini OpenAI.
Глубокая модель языка R1 от DeepSeek привлекла значительное внимание в феврале благодаря своей способности конкурировать с признанными лидерами, такими как ChatGPT, предлагая при этом более доступную альтернативу. Теперь кажется, что Alibaba стремится сделать еще один шаг вперед в этой области.
В соответствии с объяснением VentureBeat, для работы DeepSeek-R1 требуется массивные 671 миллиард параметров, из которых активными являются только 37 миллиардов. В отличие от этого, новый QwQ-32b от Alibaba эффективно работает всего с 32 миллиардами параметров. Эти цифры могут показаться сложными, но они означают значительную разницу в вычислительной мощности. DeepSeek R1 требует впечатляющих 1600 ГБ видеопамяти для работы, в то время как QwQ-32b может обойтись скромными 24 ГБ видеопамяти. Обычно это требовало бы высокопроизводительного оборудования вроде Nvidia H100 или подобного, но даже ориентированная на игры RTX 4090 предлагает 24 ГБ. Предстоящая RTX 5090 увеличивает этот показатель до 32 ГБ.
Вы можете получить доступ и использовать программное обеспечение Alibaba QwQ-32b, поскольку оно распространяется по лицензии Apache 2.0. Примечательно, что это означает, что не только предприятия и исследователи, но и мы имеем возможность воспользоваться им, экспериментируя с чатом Alibaba Qwen. Как и DeepSeek, QwQ-32b имеет определенные ограничения, однако он предлагает некоторые немедленные преимущества, которые я нашел весьма привлекательными.
Модель кажется предоставляет подробные ответы даже на простые и быстрые вопросы. Хотя это может быть полезно, она часто предоставляет больше информации, чем необходимо, что делает ее несколько раздражающей из-за избыточного контекста. Однако я ценю то, что она демонстрирует весь свой мыслительный процесс, который напоминает функцию глубокого мышления ChatGPT, хотя он углубляется гораздо меньше.
Когда возникают вопросы, касающиеся политики, Qwen Chat отмечает их как запрещенные. Я пытался найти обходной путь, и действительно, были методы обойти это с помощью DeepSeek; однако я пока не добился успеха в этом.
Пока не подтверждено, верны ли утверждения Alibaba, но похоже, что сейчас ChatGPT и DeepSeek могут столкнуться с некоторой конкуренцией.
Смотрите также
- РЕПО: Все консольные команды и как ими пользоваться
- Лучшие настройки для RTX 4060 и RTX 4060 Ti в The Last of Us Part II Remastered на ПК
- Как победить Рейдера Яшу (Winter Raiders) в игре Assassin’s Creed Shadows
- Как найти и победить деревню Ямабуси в Assassin’s Creed Shadows
- Как победить Hozoin In’ei (учеников Нобуцуны) в Assassin’s Creed Shadows
- Тур по Китаю от IShowSpeed: дата, время, ссылка на прямой эфир и другие подробности раскрыты.
- Наконец-то вы можете использовать Gemini без аккаунта Google, но есть одна загвоздка.
- Можно ли спрятать броню в Assassin’s Creed Shadows?
- Руководство по замку Осака в Assassin’s Creed Shadows: Все локации дайшо самураев, награды и многое другое
- Лучший билд на кусаригаму в игре Assassin’s Creed Shadows
2025-03-06 14:48