LLM (Large Language Model — Большая языковая модель)

Нейросеть с миллиардами параметров, обученная на огромных объёмах текста и способная генерировать, анализировать и преобразовывать текст.

LLM (Large Language Model) — это нейронная сеть огромного размера (миллиарды параметров), обученная на большом количестве текста. ChatGPT, Claude, GigaChat — все они построены на LLM.

Как это работает

В основе LLM лежит простая идея: модель учится предсказывать следующее слово в тексте. Для этого она:

Обучается на текстах — книги, статьи, сайты, код. Модель находит закономерности в языке.
Запоминает паттерны — не факты напрямую, а связи между словами и понятиями.
Генерирует ответы — получив ваш запрос, модель последовательно предсказывает каждое следующее слово ответа.

Модель	Разработчик	Особенность
Claude	Anthropic	Длинный контекст, безопасность
GPT-4o	OpenAI	Мультимодальность, широкие возможности
GigaChat	Сбер	Работа с русским языком
YandexGPT	Яндекс	Интеграция с сервисами Яндекса
Gemini	Google	Большое контекстное окно

Умеют: писать тексты, отвечать на вопросы, переводить, анализировать документы, генерировать код. Не умеют: искать в интернете в реальном времени (без специальных инструментов), гарантировать точность фактов, обучаться на ваших данных в процессе диалога.

Связанные термины

Трансформер — архитектура нейросети, на которой построены все современные LLM
Токены — единицы текста, которыми оперирует LLM
Инференс — процесс генерации ответа языковой моделью

Источники

Jailbreak (джейлбрейк)

LoRA (Low-Rank Adaptation)

LLM (Large Language Model — Большая языковая модель)

Как это работает

Популярные LLM

Что LLM умеют и чего не умеют

Связанные термины

Источники