Основная терминология искусственного интеллекта.
В этой статье мы с вами разбираемся в использование разных терминов из этой области, вы не редко могли сталкиваться с ситуацией когда, кто-то говорит такие фразы, как “продвинутая аналитика” и “машинное обучение”, часто используются вместе с ИИ.
Вам нужно понимать значения этих слов, хотя-бы чтоб быть в контексте что имеется ввиду.
Одна из проблем ИИ заключается в том, что это междисциплинарная область, где сложно дать даже базовые определения. Здесь мы сосредоточимся на трех терминах и взаимосвязи между ними: ИИ, машинное обучение и наука о данных.
Искусственный интеллект (ИИ)
ИИ объединяет три дисциплины — математику, информатику и когнитивистику — для имитации поведения человека с помощью различных технологий.
Весь ИИ, существующий сегодня, является специализированным или узким ИИ. Это важное различие, поскольку многие считают ИИ общей способностью рассуждать и воспринимать. Это известно как общий искусственный интеллект (AGI), который на данный момент технически невозможен.
Эта технология быстро развивается, и ни научное сообщество, ни промышленность не пришли к единому определению.
Некоторые распространенные определения искусственного интеллекта включают:
- Раздел компьютерных наук, занимающийся моделированием интеллектуального поведения компьютеров.
- Передовые статистические и аналитические методы, такие как машинное обучение и искусственные нейронные сети, особенно глубокое обучение.
- Компьютерная система, способная выполнять специфические задачи, которые обычно требуют человеческого интеллекта, такие как визуальное восприятие, распознавание речи, принятие решений и языковой перевод.
Термин “искусственный интеллект” включает следующее:
- Любая искусственная система, которая выполняет задачи в изменяющихся и непредсказуемых обстоятельствах без существенного контроля со стороны человека или которая может учиться на опыте и повышать производительность при воздействии наборов данных.
- Искусственная система, разработанная в компьютерном программном обеспечении, физическом оборудовании или в другом контексте, которая решает задачи, требующие человеческого восприятия, познания, планирования, обучения, коммуникации или физических действий.
- Искусственная система, предназначенная для того, чтобы думать или действовать как человек, включая когнитивные архитектуры и нейронные сети.
- Набор методов, включая машинное обучение, который предназначен для приближения к когнитивной задаче.
- Искусственная система, предназначенная для рационального действия, включая интеллектуального программного агента или воплощенного робота, который достигает целей, используя восприятие, планирование, рассуждения, обучение, коммуникацию, принятие решений и действия.
Важно иметь в виду, что определение ИИ все еще развивается и что достижения в этой области сегодня были достигнуты в области ИИ, ориентированного на конкретные задачи, или “узкого ИИ”, в отличие от того, что обычно называют общим искусственным интеллектом, который может выполнять широкий спектр задач, как люди.
Важно иметь в виду, что определение ИИ все еще развивается и что достижения в этой области сегодня были достигнуты в области ИИ, ориентированного на конкретные задачи, или “узкого ИИ”, в отличие от того, что обычно называют общим искусственным интеллектом, который может выполнять широкий спектр задач, как люди.
Наука о данных
Наука о данных – это обширная область, которая охватывает широкий спектр методов аналитики и информатики. Эта область, а также различные профессии, занимающиеся исследованием данных, являются критически важным компонентом для создания решений в области ИИ.
На практике наука о данных представляет собой межфункциональную дисциплину, сочетающую элементы информатики, математики, статистики и предметных знаний. Целью науки о данных является создание основанных на данных аналитических данных и процессов, которые могут помочь решать бизнес-, операционные и стратегические проблемы для различных типов организаций. Это часто, хотя и не всегда, достигается с помощью машинного обучения и возможностей искусственного интеллекта.
На протяжении этих глав мы будем часто ссылаться на науку о данных и команды по науке о данных. Это команды, которые поддерживают многочисленные усилия по обработке данных и ИИ, предпринимаемые в государственных учреждениях.
Машинное обучение (ML)
Машинное обучение (ML) – относится к области и практике использование алгоритмов, которые способны “обучаться” – путем извлечения шаблонов из большого массива данных.
Это контрастирует с традиционным использованием алгоритмов, основанных на правилах. Процесс построения модели машинного обучения по своей природе представляет собой итеративный подход к решению проблем (ML) используют адаптивный подход , который просматривает большое количество всех возможных результатов и выбирает результат, который наилучшим способом удовлетворяет его целевой функции.
Хотя различные формы ML существуют уже много лет, последние достижения в технологии предоставляют базовые возможности, которые позволили ML стать такими же многообещающими, какими они являются сегодня. Увеличение вычислительной мощности (особенно гибкой вычислительной инфраструктуры в облаке), крупномасштабные маркированные наборы данных и широко распространенные программные фреймворки и коды ML с открытым исходным кодом способствовали разработке моделей ML. Благодаря этим достижениям точность прогнозирования ML и количество проблем, которые ML может решить, резко возросли за последнее десятилетие.
Существует три высокоуровневых категории машинного обучения :
- Обучение под наблюдением
- Обучение без учителя
- Обучение с подкреплением
Каждая имеет свою математическую основу, и у каждой есть своя уникальная область применения. Иногда в более сложных рабочих процессах они могут комбинироваться.
Контролируемое обучение, также известное как контролируемое машинное обучение, определяется использованием помеченных наборов данных для обучения алгоритмов точной классификации данных или прогнозирование результатов.
- Входные данные подаются в модель.
- Веса корректируются до тех пор, пока модель не будет соответствующим образом подобрана, т.е. обобщит и адекватно представит шаблон.
- Обучающий набор данных используется для обучения моделей получению желаемого результата и включает входные данные, которые правильно классифицированы или “помечены”, что позволяет модели обучаться с течением времени. Алгоритм измеряет свою точность с помощью функции потерь, корректируя ее до тех пор, пока ошибка не будет в достаточной степени сведена к минимуму.
Модели обучения под наблюдением могут использоваться для создания и продвижения ряда важных приложений, таких как:
- Распознавание изображений и объектов – это прикладные методы компьютерного зрения, которые используются для обнаружения экземпляров объектов определенного типа классификации, таких как автомобиль или пешеход. Например, в здравоохранении система искусственного интеллекта может научиться распознавать, какие клетки являются предраковыми, а какие нет, чтобы помочь медицинским работникам провести более раннюю диагностику по сравнению с тем, что медицинский работник мог бы определить самостоятельно.
- Прогнозная аналитика используется для обеспечения глубокого анализа различных точек данных и позволяет прогнозировать результаты на основе заданных выходных переменных. Примеры прогнозной аналитики включают кредитный рейтинг для прогнозирования вероятности своевременной оплаты на основе факторов, включая данные клиента и кредитную историю.
- Анализ настроений клиентов используется для извлечения и классификации важных фрагментов информации из больших объемов данных, включая контекст, эмоции и намерения. Это может быть полезно для получения понимания взаимодействия с клиентами и может быть использовано для улучшения качества обслуживания клиентов.
- Обнаружение спама используется для обучения баз данных распознавать закономерности или аномалии в новых данных для эффективной организации электронных писем, не связанных со спамом. Как следует из названия, его можно использовать для обнаружения спама, улучшения взаимодействия с пользователями и снижения уровня кибермошенничества и злоупотреблений.
Обучение без учителя часто используется для анализа данных до постановки цели обучения. В машинном обучении без учителя используются немаркированные данные. На основе этих данных выявляются закономерности, которые помогают решать проблемы кластеризации или ассоциации. Это полезно, когда эксперты в предметной области не уверены в общих свойствах набора данных. Модели обучения без учителя используются для решения трех основных задач — кластеризации, объединения и уменьшения размерности. Кластеризация – это метод интеллектуального анализа данных, который группирует немаркированные данные на основе их сходства или различий. Ассоциирование используется для обнаружения интересных взаимосвязей между переменными в наборе данных. Уменьшение размерности используется для уменьшения количества измерений при сохранении значимых свойств, близких к исходным данным.
Методы машинного обучения стали распространенным методом улучшения взаимодействия с пользователем. Обучение без учителя обеспечивает поисковый путь анализа данных для более быстрого выявления закономерностей в больших объемах по сравнению с ручным наблюдением для определения кластеров или ассоциаций.
Вот некоторые из наиболее распространенных реальных применений неконтролируемого обучения::
- Новостные ленты: используются для категоризации или “объединения в группы” статей об одной и той же истории из различных новостных онлайн-изданий.
- Компьютерное зрение: используется для задач визуального восприятия, таких как распознавание объектов.
- Медицинская визуализация: используется в радиологии и патологии для быстрой и точной диагностики пациентов.
- Обнаружение аномалий: используется для обработки больших объемов данных и обнаружения нетипичных точек данных в наборе данных.
- Персоналии клиентов: используются для понимания общих черт и создания лучших профилей личности покупателя.
- Механизмы рекомендаций: использует данные о поведении в прошлом для выявления тенденций данных, которые могут быть использованы для разработки индивидуальных рекомендаций.
Обучение с подкреплением – это поведенческая модель машинного обучения, которая похожа на обучение под наблюдением, но алгоритм обучается не на основе выборочных данных. Эта модель обучается по ходу работы методом проб и ошибок. Последовательность успешных результатов будет подкреплена для разработки наилучшей рекомендации для данной проблемы.
Приложения, использующие обучение с подкреплением:
- Автономные транспортные средства: используется для самоуправляемых автомобилей, обучение с подкреплением повышает безопасность и производительность
- Промышленная автоматизация: используется для управления системами ОВКВ в зданиях, центрах обработки данных и различных промышленных центрах, что приводит к увеличению экономии энергии.
- Торговля и финансы: модели временных рядов могут использоваться для прогнозирования будущих продаж, а также цен на акции
- Язык и текст: используются для обобщения текста, вопросов и ответов, а также для языкового перевода с использованием обработки естественного языка
- Здравоохранение: используется для поиска оптимальных политик и процедур с использованием предыдущего опыта ухода за пациентами без необходимости в предварительной информации.
Ключевые идеи
- В обучении под руководством используются помеченные наборы данных для обучения алгоритмов классификации данных или прогнозирования результатов.
- В обучении без учителя используются немаркированные данные. На основе этих данных выявляются закономерности, которые помогают решать проблемы кластеризации или объединения.
- Последовательность успешного обучения с подкреплением результатов будет усилена для разработки наилучших рекомендаций для данной проблемы.
- В решениях ИИ используется один или, в некоторых случаях, несколько из этих методов управления.