20 термінів із галузі штучного інтелекту (ШІ), які варто знати

Штучний інтелект (ШІ) - це запрограмована здатність машини виконувати людські завдання. Епоха ШІ розвивається в геометричній прогресії, й щоб стежити за інноваціями, варто мати уявлення про ключові терміни в цій галузі. Які ж основні терміни у сфері ШІ та які фундаментальні ідеї вони відображають? Ось глосарій термінів, який допоможе вам бути в тренді.

Алгоритм (Algorithm): Систематизований набір інструкцій, яких дотримується машина, щоб виконати певне завдання або вирішити проблему. Ці алгоритми дозволяють системам ШІ навчатися на основі даних, приймати рішення та покращувати свою роботу з часом на основі вхідних даних і визначених правил або шаблонів. Це сама основа ШІ.

Великі дані(Big Data:): Інформація, яка настільки велика за обсягом, що її просто неможливо обробити традиційними методами. Це комбінація даних з багатьох джерел, і закономірності, виявлені в таких комбінаціях даних, можуть впливати на прийняття рішень у бізнесі, науці, сільському господарстві тощо. Прикладом може слугувати те, як пакет погодної аналітики Deep Thunder від IBM допоміг фермерам визначити найкращий час для зрошення їхніх посівів, або як програма British Airways "Know Me Program" використовувала великі дані, щоб дізнатися більше про вподобання клієнтів. 

Чатбот (Chatbot): Іноді його називають просто "бот" - це коли комп'ютерна програма обробляє мову і веде реальну розмову з людиною. Чат-боти дедалі ширше використовуються для виконання завдань з обслуговування клієнтів. Оскільки чат-боти працюють на основі штучного інтелекту, вони можуть працювати 24/7 і обслуговувати необмежену кількість клієнтів у будь-який часовий проміжок. 

Когнітивні обчислення (Cognitive Computing): Система штучного інтелекту "імітує" або моделює людські думки та когнітивні процеси. У широкому сенсі когнітивні обчислення є основою "інтелекту" в штучному інтелекті. 

Корпус (лат. Corpus): З латинської "тіло", корпус в ШІ означає великий масив мови - письмової або усної, - який використовується для навчання моделей машинного навчання (див. нижче про машинне навчання). Наприклад, Google Translate базується на корпусі. 

Добування даних (Data Mining): Процес, під час якого на основі великих наборів даних виявляються кореляції та закономірності з кінцевою метою прогнозування результатів. Наприклад, Netflix рекомендує серіали на основі демографічних даних користувачів, історії пошуку, списків перегляду, рейтингів тощо. 

Глибоке навчання(Deep Learning): Галузь машинного навчання, яка бере свій початок у штучних нейронних мережах (див. нижче про нейронні мережі). Його називають "глибоким" навчанням через багаторівневу обробку, необхідну для виявлення більш високих рівнів властивостей у даних. Завдяки своїй здатності фіксувати деталі, глибоке навчання можна застосовувати для розпізнавання тексту, зображень, звуків тощо. 

Генеративний ШІ(Generative AI): здатність машин "генерувати" новий контент на основі наявного набору даних. Цей контент може бути аудіо, візуальним (наприклад, зображення і відео) або текстовим. ChatGPT і Google Bard з їхньою здатністю створювати контент для особистого або комерційного використання є прикладами генеративного ШІ.

Галюцинація: Результат роботи ШІ-програми, який не можна легко обґрунтувати навчальними даними. Поширеним прикладом є ситуація, коли ChatGPT дає фактично неправдиві відповіді на запити. 

Гіперпараметр: Специфічні параметри, які регулюють процес навчання моделі машинного навчання, що використовуються для оптимізації моделей навчання (для порівняння див. параметр нижче).

Машинне навчання (Machine Learning, ML): Процес, при якому машина запрограмована навчатися на основі даних, без необхідності в явному програмуванні людиною. Поширеним застосуванням машинного навчання є розпізнавання обличчя та розпізнавання голосу для розблокування мобільних пристроїв.

Нейронна мережа: Модель машинного навчання, яка спирається на внутрішню роботу людського мозку. Коли машина обробляє зображення обличчя, вона може, як і людина, спочатку визначити, чи належить воно чоловікові, чи жінці. Нейронні мережі є основою для відображення людського інтелекту, який потім може бути використаний для створення ШІ. 

Обробка природної мови (Natural Language Processing, NLP): Ширша галузь комп'ютерних наук, яка вивчає, як комп'ютери взаємодіють з природною мовою, яку використовують люди. NLP лежить на перетині лінгвістики та комп'ютерних наук; за допомогою NLP комп'ютери можуть обробляти людську мову і в результаті виконувати корисні завдання. Перевірка орфографії, предикативні тексти, машинний переклад і перетворення мови в текст - все це застосування НЛП. 

Великі мовні моделі (Large Language Models, LLM): Застосування глибокого навчання в галузі лінгвістики, великі мовні моделі дозволяють машині розуміти, а отже, створювати текст, подібний до людського. LLM містять величезні набори лінгвістичних даних (часто отриманих з Інтернету); системи GPT OpenAI, наприклад, побудовані на основі LLM. 

Перенавчання: Коли модель машинного навчання занадто тісно пов'язана з певним набором даних і не здатна до узагальнення. Це трапляється, коли навчальний набір даних занадто малий, або якщо набір даних складається із занадто великої кількості нерелевантних ("зашумлених") даних.

Параметр: Походячи з математичних концепцій, параметр - це конфігураційна змінна, що входить до складу моделі машинного навчання. Його можна застосовувати для прогнозування. 

Навчання з підкріпленням(Reinforcement Learning): Процес, при якому машина навчається з часом шляхом спроб і помилок. Подібно до навчання з підкріпленням у людей, машина "винагороджується" за правильні кроки й "карається" за неправильні. З часом машина навчиться добре виконувати завдання. Багато безпілотних автомобілів мають програми навчання з підкріпленням, коли автомобіль зрештою вчиться правильно їздити після того, як його запрограмували на основі помилок і виправлень. 

Кероване навчання(Supervised Learning): Це коли машина навчається за допомогою так званих "маркованих" даних, використовуючи зворотний зв'язок безпосередньо для перевірки точності результатів. Наприклад, кероване навчання може допомогти комп'ютерам виявляти спам в електронних листах, оскільки спам-повідомлення часто мають певні шаблони, які можна "маркувати".

Некероване навчання: Протилежність керованому навчанню, коли машина навчається на "немаркованих" даних; машина не отримує зворотного зв'язку для свого навчання. За допомогою неконтрольованого навчання машини можуть ідентифікувати закономірності без втручання людини, що робить його ідеальним для дослідження даних.

Передавальне навчання(Transfer Learning): Це процес, коли модель машинного навчання, вже навчена в одній задачі, "переносить" свій "інтелект" на іншу задачу. Широко відомим прикладом є розпізнавання зображень: машина може "навчитися" розпізнавати особливості транспортного засобу, а потім бути здатною, наприклад, ідентифікувати мотоцикл, використовуючи навчання з перенесенням.

Терміни та поняття ШІ: Готуємося до майбутнього

Вище наведено лише кілька прикладів з-поміж величезної кількості термінів у сфері ШІ, але в майбутньому ці терміни стануть добрим підґрунтям для всіх, хто зацікавлений у розширенні своїх знань в епоху ШІ. В умовах розквіту ідей у сфері ШІ перед людьми постає завдання творчо підійти до того, що ШІ може зробити для багатьох аспектів людського розвитку. Наприклад, як навчання з підкріпленням може покращити діагностику в клінічних умовах? Як можна використовувати обробку природної мови для виконання завдань з перетворення мови в текст з регіональними або іноземними акцентами? Застосування та простір для інноваційного мислення у сфері ШІ незмірні, тож час готуватися і вчитися - вже зараз. 

Олексій - комп'ютерний ентузіаст та завзятий геймер, що розпочинав знайомство з ПК у часи Intel 80286. Палкий прихильник ігрових ноутбуків Acer Nitro та трансформерів 2-в-1 серії Spin. У минулому - тестовий інженер та керівник тестлабу видання CHIP Україна, IT-журналіст з 20-річним досвідом, редактор низки провідних українських комп'ютерних видань.

Позначено тегом:

Офіційні соціальні мережі