Что такое ИИ, Data Science, и Machine Learning (ML) в чем разница?

Основная терминология искусственного интеллекта.

В этой статье мы с вами разбираемся в использование разных терминов из этой области, вы не редко могли сталкиваться с ситуацией когда, кто-то говорит такие фразы, как “продвинутая аналитика” и “машинное обучение”, часто используются вместе с ИИ.

Вам нужно понимать значения этих слов, хотя-бы чтоб быть в контексте что имеется ввиду.

Одна из проблем ИИ заключается в том, что это междисциплинарная область, где сложно дать даже базовые определения. Здесь мы сосредоточимся на трех терминах и взаимосвязи между ними: ИИ, машинное обучение и наука о данных.

Искусственный интеллект (ИИ)

ИИ объединяет три дисциплины — математику, информатику и когнитивистику — для имитации поведения человека с помощью различных технологий. 

Весь ИИ, существующий сегодня, является специализированным или узким ИИ. Это важное различие, поскольку многие считают ИИ общей способностью рассуждать и воспринимать. Это известно как общий искусственный интеллект (AGI), который на данный момент технически невозможен.

Эта технология быстро развивается, и ни научное сообщество, ни промышленность не пришли к единому определению.

Некоторые распространенные определения искусственного интеллекта включают:

  • Раздел компьютерных наук, занимающийся моделированием интеллектуального поведения компьютеров.
  • Передовые статистические и аналитические методы, такие как машинное обучение и искусственные нейронные сети, особенно глубокое обучение.
  • Компьютерная система, способная выполнять специфические задачи, которые обычно требуют человеческого интеллекта, такие как визуальное восприятие, распознавание речи, принятие решений и языковой перевод.

Термин “искусственный интеллект” включает следующее:

  • Любая искусственная система, которая выполняет задачи в изменяющихся и непредсказуемых обстоятельствах без существенного контроля со стороны человека или которая может учиться на опыте и повышать производительность при воздействии наборов данных.
  • Искусственная система, разработанная в компьютерном программном обеспечении, физическом оборудовании или в другом контексте, которая решает задачи, требующие человеческого восприятия, познания, планирования, обучения, коммуникации или физических действий.
  • Искусственная система, предназначенная для того, чтобы думать или действовать как человек, включая когнитивные архитектуры и нейронные сети.
  • Набор методов, включая машинное обучение, который предназначен для приближения к когнитивной задаче.
  • Искусственная система, предназначенная для рационального действия, включая интеллектуального программного агента или воплощенного робота, который достигает целей, используя восприятие, планирование, рассуждения, обучение, коммуникацию, принятие решений и действия.

Важно иметь в виду, что определение ИИ все еще развивается и что достижения в этой области сегодня были достигнуты в области ИИ, ориентированного на конкретные задачи, или “узкого ИИ”, в отличие от того, что обычно называют общим искусственным интеллектом, который может выполнять широкий спектр задач, как люди.


Важно иметь в виду, что определение ИИ все еще развивается и что достижения в этой области сегодня были достигнуты в области ИИ, ориентированного на конкретные задачи, или “узкого ИИ”, в отличие от того, что обычно называют общим искусственным интеллектом, который может выполнять широкий спектр задач, как люди.


Наука о данных

Наука о данных – это обширная область, которая охватывает широкий спектр методов аналитики и информатики. Эта область, а также различные профессии, занимающиеся исследованием данных, являются критически важным компонентом для создания решений в области ИИ.

На практике наука о данных представляет собой межфункциональную дисциплину, сочетающую элементы информатики, математики, статистики и предметных знаний. Целью науки о данных является создание основанных на данных аналитических данных и процессов, которые могут помочь решать бизнес-, операционные и стратегические проблемы для различных типов организаций. Это часто, хотя и не всегда, достигается с помощью машинного обучения и возможностей искусственного интеллекта.

На протяжении этих глав мы будем часто ссылаться на науку о данных и команды по науке о данных. Это команды, которые поддерживают многочисленные усилия по обработке данных и ИИ, предпринимаемые в государственных учреждениях.

Машинное обучение (ML)

Машинное обучение (ML) – относится к области и практике использование алгоритмов, которые способны “обучаться” – путем извлечения шаблонов из большого массива данных.

Это контрастирует с традиционным использованием алгоритмов, основанных на правилах. Процесс построения модели машинного обучения по своей природе представляет собой итеративный подход к решению проблем (ML) используют адаптивный подход , который просматривает большое количество всех возможных результатов и выбирает результат, который наилучшим способом удовлетворяет его целевой функции.

Хотя различные формы ML существуют уже много лет, последние достижения в технологии предоставляют базовые возможности, которые позволили ML стать такими же многообещающими, какими они являются сегодня. Увеличение вычислительной мощности (особенно гибкой вычислительной инфраструктуры в облаке), крупномасштабные маркированные наборы данных и широко распространенные программные фреймворки и коды ML с открытым исходным кодом способствовали разработке моделей ML. Благодаря этим достижениям точность прогнозирования ML и количество проблем, которые ML может решить, резко возросли за последнее десятилетие.

Существует три высокоуровневых категории машинного обучения :

  1. Обучение под наблюдением
  2. Обучение без учителя
  3. Обучение с подкреплением

Каждая имеет свою математическую основу, и у каждой есть своя уникальная область применения. Иногда в более сложных рабочих процессах они могут комбинироваться.

Контролируемое обучение, также известное как контролируемое машинное обучение, определяется использованием помеченных наборов данных для обучения алгоритмов точной классификации данных или прогнозирование результатов.

  • Входные данные подаются в модель.
  • Веса корректируются до тех пор, пока модель не будет соответствующим образом подобрана, т.е. обобщит и адекватно представит шаблон.
  • Обучающий набор данных используется для обучения моделей получению желаемого результата и включает входные данные, которые правильно классифицированы или “помечены”, что позволяет модели обучаться с течением времени. Алгоритм измеряет свою точность с помощью функции потерь, корректируя ее до тех пор, пока ошибка не будет в достаточной степени сведена к минимуму.

Модели обучения под наблюдением могут использоваться для создания и продвижения ряда важных приложений, таких как:

  • Распознавание изображений и объектов – это прикладные методы компьютерного зрения, которые используются для обнаружения экземпляров объектов определенного типа классификации, таких как автомобиль или пешеход. Например, в здравоохранении система искусственного интеллекта может научиться распознавать, какие клетки являются предраковыми, а какие нет, чтобы помочь медицинским работникам провести более раннюю диагностику по сравнению с тем, что медицинский работник мог бы определить самостоятельно.
  • Прогнозная аналитика используется для обеспечения глубокого анализа различных точек данных и позволяет прогнозировать результаты на основе заданных выходных переменных. Примеры прогнозной аналитики включают кредитный рейтинг для прогнозирования вероятности своевременной оплаты на основе факторов, включая данные клиента и кредитную историю.
  • Анализ настроений клиентов используется для извлечения и классификации важных фрагментов информации из больших объемов данных, включая контекст, эмоции и намерения. Это может быть полезно для получения понимания взаимодействия с клиентами и может быть использовано для улучшения качества обслуживания клиентов.
  • Обнаружение спама используется для обучения баз данных распознавать закономерности или аномалии в новых данных для эффективной организации электронных писем, не связанных со спамом. Как следует из названия, его можно использовать для обнаружения спама, улучшения взаимодействия с пользователями и снижения уровня кибермошенничества и злоупотреблений.

Обучение без учителя часто используется для анализа данных до постановки цели обучения. В машинном обучении без учителя используются немаркированные данные. На основе этих данных выявляются закономерности, которые помогают решать проблемы кластеризации или ассоциации. Это полезно, когда эксперты в предметной области не уверены в общих свойствах набора данных. Модели обучения без учителя используются для решения трех основных задач — кластеризации, объединения и уменьшения размерности. Кластеризация – это метод интеллектуального анализа данных, который группирует немаркированные данные на основе их сходства или различий. Ассоциирование используется для обнаружения интересных взаимосвязей между переменными в наборе данных. Уменьшение размерности используется для уменьшения количества измерений при сохранении значимых свойств, близких к исходным данным.

Методы машинного обучения стали распространенным методом улучшения взаимодействия с пользователем. Обучение без учителя обеспечивает поисковый путь анализа данных для более быстрого выявления закономерностей в больших объемах по сравнению с ручным наблюдением для определения кластеров или ассоциаций.

Вот некоторые из наиболее распространенных реальных применений неконтролируемого обучения::

  • Новостные ленты: используются для категоризации или “объединения в группы” статей об одной и той же истории из различных новостных онлайн-изданий.
  • Компьютерное зрение: используется для задач визуального восприятия, таких как распознавание объектов.
  • Медицинская визуализация: используется в радиологии и патологии для быстрой и точной диагностики пациентов.
  • Обнаружение аномалий: используется для обработки больших объемов данных и обнаружения нетипичных точек данных в наборе данных.
  • Персоналии клиентов: используются для понимания общих черт и создания лучших профилей личности покупателя.
  • Механизмы рекомендаций: использует данные о поведении в прошлом для выявления тенденций данных, которые могут быть использованы для разработки индивидуальных рекомендаций.

Обучение с подкреплением – это поведенческая модель машинного обучения, которая похожа на обучение под наблюдением, но алгоритм обучается не на основе выборочных данных. Эта модель обучается по ходу работы методом проб и ошибок. Последовательность успешных результатов будет подкреплена для разработки наилучшей рекомендации для данной проблемы.

Приложения, использующие обучение с подкреплением:

  • Автономные транспортные средства: используется для самоуправляемых автомобилей, обучение с подкреплением повышает безопасность и производительность
  • Промышленная автоматизация: используется для управления системами ОВКВ в зданиях, центрах обработки данных и различных промышленных центрах, что приводит к увеличению экономии энергии.
  • Торговля и финансы: модели временных рядов могут использоваться для прогнозирования будущих продаж, а также цен на акции
  • Язык и текст: используются для обобщения текста, вопросов и ответов, а также для языкового перевода с использованием обработки естественного языка
  • Здравоохранение: используется для поиска оптимальных политик и процедур с использованием предыдущего опыта ухода за пациентами без необходимости в предварительной информации.

Ключевые идеи

  • В обучении под руководством используются помеченные наборы данных для обучения алгоритмов классификации данных или прогнозирования результатов.
  • В обучении без учителя используются немаркированные данные. На основе этих данных выявляются закономерности, которые помогают решать проблемы кластеризации или объединения.
  • Последовательность успешного обучения с подкреплением результатов будет усилена для разработки наилучших рекомендаций для данной проблемы.
  • В решениях ИИ используется один или, в некоторых случаях, несколько из этих методов управления.

А вы что думаете?
0%
0%
0%
0%
0%
0%
0%
admin

Recent Posts

Как работают поисковые системы?

Что такое поисковые системы? Поисковые системы – это сложные программные комплексы, предназначенные для поиска информации…

3 месяца ago

Кто следит за вами в интернете?

Интернет – это невероятное пространство возможностей, но одновременно и место, где за вашей онлайн-активностью может…

3 месяца ago

Как защитить свою конфиденциальность?

В современном цифровом мире защита конфиденциальности стала первостепенной задачей. Каждый день мы оставляем следы своей…

3 месяца ago

Что такое анонимность в интернете?

Что это такое? Анонимность в интернете – это состояние, при котором ваша личность и действия…

3 месяца ago

Защита от фишинга: действенные методы

Фишинг – это одна из самых распространенных киберугроз, которая ежегодно обходится пользователям интернета в миллионы…

3 месяца ago

Защита данных в облаке: реальность или миф?

Что такое защита данных в облаке? Защита данных в облаке – это комплекс мер, направленных…

3 месяца ago