Глоссарий AI-терминов

50 терминов с объяснениями на русском языке.

A C E F G I J L M O P R T Z А Б В Г Д З И К Л М П Р С Т Ч Э

A

AI-агент (AI Agent)

Автономная AI-система, которая самостоятельно планирует действия, использует инструменты и выполняет многошаговые задачи без постоянного контроля человека.

API (Application Programming Interface)

Программный интерфейс для взаимодействия с языковой моделью из кода — позволяет встраивать AI в приложения, сайты и сервисы.

Alignment (выравнивание AI)

Процесс обучения AI-модели действовать в соответствии с намерениями человека, быть полезной, честной и безопасной.

C

Completion (дополнение текста)

Базовый режим работы языковой модели, при котором она продолжает или завершает начатый текст на основе вероятностей.

E

Evaluation (оценка качества LLM)

Процесс систематической оценки качества AI-модели: насколько точно, полезно и безопасно она отвечает на разные типы задач.

F

Few-shot обучение (Few-shot Learning)

Способность языковой модели выполнять задачу на основе нескольких примеров, приведённых прямо в промпте, без дополнительного обучения.

Fine-tuning (Дообучение)

Процесс дополнительного обучения готовой языковой модели на специализированных данных для адаптации под конкретную задачу или домен.

G

Grounding (заземление)

Привязка ответов AI-модели к фактическим данным и достоверным источникам для снижения галлюцинаций.

I

In-Context Learning (обучение в контексте)

Способность AI-модели учиться на примерах, предоставленных прямо в промпте, без изменения своих параметров и дополнительного обучения.

J

Jailbreak (джейлбрейк)

Попытка обойти встроенные ограничения AI-модели, чтобы получить ответы, которые она обычно отказывается давать.

L

LLM (Large Language Model — Большая языковая модель)

Нейросеть с миллиардами параметров, обученная на огромных объёмах текста и способная генерировать, анализировать и преобразовывать текст.

LoRA (Low-Rank Adaptation)

Метод эффективного дообучения AI-моделей, позволяющий адаптировать большую модель под конкретную задачу с минимальными затратами ресурсов.

M

MCP (Model Context Protocol)

Открытый стандарт подключения внешних инструментов и данных к AI-моделям. Создан Anthropic как единый протокол интеграции.

O

Open Source модели

AI-модели с открытым исходным кодом и весами, которые можно скачать, изучить, модифицировать и запустить самостоятельно.

P

Prompt Injection (инъекция в промпт)

Атака на AI-модель, при которой злоумышленник встраивает скрытые инструкции в текст, чтобы заставить модель игнорировать свои правила.

R

RAG (Retrieval-Augmented Generation)

Технология, при которой языковая модель сначала ищет релевантную информацию в базе знаний, а затем формирует ответ на её основе.

RLHF (Обучение с подкреплением на основе обратной связи от людей)

Метод обучения языковых моделей, при котором люди оценивают ответы модели, а модель учится генерировать более полезные и безопасные ответы.

T

Tool Use / Function Calling

Способность AI-модели вызывать внешние инструменты и функции: поиск в интернете, выполнение кода, работа с API и базами данных.

Top-p / Nucleus Sampling (Ядерная выборка)

Параметр, ограничивающий выбор следующего слова только самыми вероятными вариантами. Контролирует разнообразие ответов модели.

Z

Zero-shot обучение (Zero-shot Learning)

Способность модели решать задачи, для которых она не видела примеров — только описание задачи.

А

Агентные воркфлоу (Agentic Workflows)

Рабочие процессы, в которых AI-агенты самостоятельно выполняют цепочки задач: планируют, вызывают инструменты, проверяют результат и адаптируются.

Б

Бенчмарк (Benchmark)

Стандартный тест для измерения производительности и качества AI-моделей. Позволяет объективно сравнивать разные модели между собой.

В

Векторная база данных (Vector Database)

Специализированная база данных для хранения и быстрого поиска по эмбеддингам — числовым представлениям текста, изображений и других данных.

Г

Галлюцинации (Hallucinations)

Ситуация, когда языковая модель уверенно генерирует ложную, выдуманную или неточную информацию, выдавая её за факт.

Гарды (Guardrails)

Защитные механизмы и фильтры, ограничивающие поведение AI-модели: блокировка опасного контента, проверка фактов, контроль формата ответов.

Д

Дистилляция (Knowledge Distillation)

Метод переноса знаний из большой AI-модели в маленькую. Компактная модель-ученик учится воспроизводить поведение модели-учителя.

З

Законы масштабирования (Scaling Laws)

Закономерности, показывающие, что качество AI-модели предсказуемо растёт с увеличением данных, размера модели и объёма вычислений.

Закрытые модели (Closed Source)

AI-модели, доступные только через API или веб-интерфейс. Веса и код модели не публикуются. Примеры: GPT-4, Claude, GigaChat.

И

Инференс (Inference)

Процесс генерации ответа языковой моделью — момент, когда обученная модель принимает запрос и выдаёт результат.

К

Квантизация (Quantization)

Метод сжатия AI-модели путём снижения точности числовых параметров. Уменьшает размер модели и ускоряет её работу с минимальной потерей качества.

Контекстное окно (Context Window)

Максимальный объём текста (в токенах), который языковая модель может обработать за один запрос — включая и ваш ввод, и ответ модели.

Косинусное сходство (Cosine Similarity)

Математическая метрика, измеряющая смысловую близость двух текстов через угол между их числовыми представлениями (векторами).

Л

Латентность (Latency)

Время отклика языковой модели — задержка между отправкой запроса и получением первых слов ответа.

М

Механизм внимания (Attention)

Ключевой компонент трансформеров, позволяющий модели определять, какие части текста наиболее важны для понимания каждого слова.

Мультимодальность (Multimodal)

Способность AI-модели работать с несколькими типами данных одновременно — текст, изображения, аудио, видео.

П

Перплексия (Perplexity)

Метрика качества языковой модели, показывающая, насколько уверенно модель предсказывает следующее слово. Чем ниже перплексия — тем лучше.

Промпт (Prompt)

Текстовый запрос или инструкция, которую пользователь отправляет языковой модели для получения ответа.

Промпт-инженерия (Prompt Engineering)

Навык и практика составления эффективных запросов к языковым моделям для получения наилучших результатов.

Пропускная способность (Throughput)

Количество запросов или токенов, которое система с языковой моделью может обработать за единицу времени.

Р

Рассуждения (Reasoning) в AI

Способность AI-модели выстраивать логические цепочки, анализировать информацию шаг за шагом и приходить к обоснованным выводам.

С

Семантический поиск (Semantic Search)

Поиск по смыслу, а не по точному совпадению слов. AI понимает значение запроса и находит релевантные результаты, даже если слова не совпадают.

Синтетические данные (Synthetic Data)

Данные, сгенерированные AI-моделью, а не собранные из реального мира. Используются для обучения и тестирования других моделей.

Системный промпт (System Prompt)

Скрытая инструкция для AI-модели, задающая её роль, стиль общения и правила поведения до начала разговора с пользователем.

Т

Температура (Temperature)

Параметр, контролирующий случайность и креативность ответов языковой модели. Низкая температура — предсказуемые ответы, высокая — творческие.

Токенизатор (Tokenizer)

Программа, которая разбивает текст на токены — минимальные единицы, с которыми работает языковая модель.

Токены (Tokens)

Единицы текста, на которые модель разбивает входные данные для обработки. Одно слово — обычно 1-3 токена.

Трансформер (Transformer)

Архитектура нейросети, лежащая в основе всех современных языковых моделей. Революционная разработка 2017 года от Google.

Ч

Чанкинг (Chunking)

Процесс разбиения длинных документов на небольшие фрагменты (чанки) для последующей индексации и поиска в системах RAG.

Чат-модель (Chat Model)

Языковая модель, обученная вести диалог в формате вопрос-ответ. ChatGPT и Claude — примеры чат-моделей.

Э

Эмбеддинги (Embeddings)

Числовые представления текста в виде вектора, позволяющие компьютеру измерять смысловую близость слов, предложений и документов.