5 лучших LLM на 2025 год

Дельта

Данная статья рассказывает о пяти лучших LLM (языковых моделях), которые можно скачать с помощью приложения LM Studio и затем запустить на вашем компьютере независимо от того, работает ли он под управлением Windows или macOS.

🚀 Хочешь улететь на Луну вместе с нами? Подписывайся на CryptoMoon! 💸 Новости крипты, аналитика и прогнозы, которые дадут твоему кошельку ракетный ускоритель! 📈 Нажмите здесь: 👇

CryptoMoon Telegram

ИИ пронизывает наш мир, и недавняя популярность эстетики Гибли вызвала широкое признание её. Однако возможности ИИ выходят далеко за пределы создания визуальных образов в стиле Гибли: он может функционировать как полезный помощник для автоматизации вашего сада, регулируя полив на основе температуры, а также служить помощником по кодированию, быстро реализуя сложные алгоритмы всего лишь за несколько секунд.

При использовании сервисов типа ChatGPT, ClaudSonnet, CoPilot Pro, DeepSeek R1 и других могут возникнуть опасения относительно приватности данных или несанкционированного мониторинга. Поэтому многие любители предпочитают запускать эти модели локально. Однако следует учитывать, что такие модели требуют значительных ресурсов: минимум 12 ГБ видеопамяти (VRAM) на любой графической карте Nvidia или AMD для обеспечения приемлемой производительности. Давайте рассмотрим возможные решения. ️

Как энтузиаст, я погружаюсь в увлекательный мир моделей искусственного интеллекта, особенно используя LM Studio как инструмент. Если вам это интересно, вы тоже можете следовать этому пути с помощью Ollama, которая имеет сходство с LM Studio. Оба этих инструмента доступны для загрузки на Hugging Face.

Помните: Модели, созданные сообществом, могут иногда генерировать контент, который не является полностью точным или подходящим для конкретных ситуаций, например оскорбительный или неприемлемый. Все рассмотренные здесь модели прошли квантование GGUF по методике Bartowski с использованием llamacpp. Важно использовать эти модели этично и ответственно, чтобы избежать любых неправомерных действий.

1. Gemma 3 (Google)

Модель языка Gemma 3 компании Google является самой последней разработкой в области языковых моделей (LM), созданную Google. В настоящее время она лидирует по популярности среди пользователей LM-студии и была загружена более 175 000 раз. Пользователи ценят её адаптивность, так как она может работать на Raspberry Pi с параметром 1 миллиард. Тем не менее важно отметить, что точность модели может не соответствовать точности более крупных моделей при большем квантовании.

Ключевые особенности

Мультимодальные возможности (текст + изображение) с контекстным окном в 128,000 токенов.
Сильная многоязычная поддержка (более 140 языков) и высокая производительность в задачах рассуждения и распознавания образов.
Доступность открытых исходников с эффективными опциями развертывания, включая версии GGUF и 4-битное квантование для местных установок.
Легко запускаться на любой конфигурации оборудования с параметрами от 1 млрд до 27 млрд.

2. DeepSeek R1 Distill Qwen 7B

В этой версии DeepSeek R1 мы реализовали инициативу сообщества, поддержанную такими участниками, как Bartowski и Mr. Adermaacher. Модель получена из релиза llamacpp. Что касается Qwen distilled R1, он был дообучён для задач фактуального рассуждения и кодирования. Также предусмотрены различные варианты квантизации: чем выше уровень квантизации, тем выше точность.

Ключевые особенности

Поддерживает контекст до 128 тысяч токенов.
Выведено из оригинальной модели DeepSeek R1-671b
Настроен для задач рассуждения и цепочек мыслей.
Превосходит в программировании и математическом мышлении.
Использует групповую относительную оптимизацию политики (GRPO) для обучения, ориентированного на рассуждения.

3. Phi-4 (Microsoft)

Знакомы ли вы с приложением Copilot на наших компьютерах? Некоторым оно кажется полезным, тогда как другие предпочитают его отключать. К счастью, благодаря вкладу сообщества, теперь можно работать с ним офлайн без необходимости постоянного подключения к интернету. Последняя версия Phi-4 была обучена на огромной базе данных из 9.8 триллионов токенов и включает синтетические данные, очищенные публичные вебсайты, академическую литературу и ресурсы вопросов и ответов.

Ключевые особенности

Поддерживает контекст до 16000 токенов.
Обрабатывает текст, речь и визуальные данные одновременно.
Эффективная мультимодальная интеграция с использованием техник на основе LoRA.
Низкая вычислительная нагрузка.
Оптимизирован для задач рассуждения и обработки цепочек мыслей.
Подходит для общих целей, математических рассуждений и решения проблем.

4. Гранит 3.2 8B (IBM)

В этой версии модели Granite 3.2 мы тщательно доработали её с акцентом на когнитивные способности, отдавая приоритет задачам, связанным с рассуждениями и последовательностями мысли. Она поддерживает такие языки как английский, немецкий, испанский, французский, японский, португальский, арабский, чешский, итальянский, корейский, голландский и китайский. Хотя Granite можно в основном рассматривать как модель параметров 2B, наиболее часто предпочитаемой среди подобных моделей является версия с параметрами 8B.

Ключевые особенности

Поддерживает контекст до 128 килобайт токенов.
Способности языкового модели с видением (VLM), оптимизированные для задач понимания документов, таких как OCRBench и DocVQA.
Режим рассуждения с цепочкой мыслей для эффективного решения задач без излишних вычислений.
Подходит для приложений корпоративного уровня, требующих высокой точности при работе с различными языками.
Оптимизирован для задач многоязычного рассуждения и структурированного решения проблем.

5. QwQ-32B (Alibaba)

Модель QWQ 32B от Alibaba была разработана на основе дизайна Qwen 2.5-32B и оптимизирована для выполнения сложных задач по рассуждениям, вычислениям и программированию. Если у вас достаточно видеопамяти или системной памяти, это может стать отличным дополнением к вашей среде кодирования при использовании совместно с continue.dev и Visual Studio Code.

Ключевые особенности

Поддерживает контекст до 128k токенов.
Обучение с подкреплением повышает способности к рассуждению, кодированию и решению проблем.
Чрезвычайно эффективен при минимальных требованиях к вычислительным ресурсам, даже ниже чем у DeepSeek R1.
Преуспевает в задачах с анализом, математических вычислениях и прикладном программировании.
Настроен на высокую точность во множестве бенчмарков при сохранении эффективности.

Основные выводы

Кроме того, пожалуйста, обратите внимание, что модели сообщества могут генерировать контент, который может быть неточным, расплывчатым или неприменимым.
Студия LM — всего лишь платформа. Сама студия LM непосредственно не создает эти модели. Это делают члены сообщества.
Пожалуйста, используйте эти модели искусственного интеллекта ответственно и избегайте неэтичного применения.

Смотрите также

2025-04-01 13:55

CryptoMoon Telegram

1. Gemma 3 (Google)

Ключевые особенности

2. DeepSeek R1 Distill Qwen 7B

Ключевые особенности

3. Phi-4 (Microsoft)

Ключевые особенности

4. Гранит 3.2 8B (IBM)

Ключевые особенности

5. QwQ-32B (Alibaba)

Ключевые особенности

Основные выводы

Смотрите также

Популярное

Переиграть главы в южной части полуночи

Лучшие настройки для RTX 3060 и RTX 3060 Ti в ремастере The Last of Us Part II на ПК

Инзои: Как увеличить карму