Data Science. Развенчиваем мифы об искусственном интеллекте и нейросетях.

Artificial Intelligence, нейросети, машинное обучение … Эти слова сейчас у всех на слуху. И эти слова очень хорошо продаются. Но действительно ли все, что называют такими красивыми громкими именами, имеет прямое отношение к искусственному интеллекту, или к нейросетям, аналогичным тем, которые функционируют в мозге человека? Сегодня развенчиваем мифы вместе с экспертами в Data Science Андреем Босым и Николаем Козленком.

Недавно председатель лаборатории искусственного интеллекта Facebook Ян Лекан раскритиковал всем известного работа Софию, которая обладает большой популярностью благодаря своей антропоморфности и активным рекламным усилиям своих создателей. София в прошлом году стала первым роботом в мире, который получил гражданство. Несмотря на все это, безусловно, Ян Лекан прав. София скорее может называться хорошим чат-ботом, но отнюдь не искусственным интеллектом. «Это хороший маркетинг и не более» — соглашается и наш эксперт Андрей Босый. Но что же тогда может на самом деле называться искусственным интеллектом? Интересно, но Андрей считает, ничего. Итак, начинаем развенчивать популярные мифы:

Миф 1. Сейчас в мире активно развивается искусственный интеллект и уже существует много примеров его воплощения. Ярким примером могут служить современные работы, которые вступают в дискуссии с собеседниками и даже выглядят как люди.

Правда: Искусственного интеллекта не существует и вряд ли когда-нибудь он вообще будет существовать.

В основе современных роботов лежит обычный ряд скриптов. Как бы нам не казалось, что они похожи на человека, что они способны на эмоции, но они не имеют отношения к настоящему интеллекту.

«Интеллект не может быть искусственным. Если задуматься собственно о понятии интеллекта, то становится очевидно, что он содержит в себе очень много составляющих — это в первую очередь самоосознание. Разве можно себе представить, чтобы компьютер осознавал себя? Также он должен самостоятельно уметь выделять различные характеристики окружающего мира, знать, что скажем одна вещь — маленькая, а другая большая, и знать это не потому, что ему об этом сказали при помощи скрипта, а потому, что он сам это понимает и осознает. Настоящий интеллект способен на любовь и самопожертву, на чувство юмора — это совсем нерациональные чувства, их невозможно выразить переменными. Интеллект способен творить совершенно новую информацию, не основываясь на определенных исходных данных. Если искусственный интеллект достигнет действительно уровня интеллекта, он уже не сможет называться искусственным. То есть, понятие «искусственный интеллект» как такое не имеет смысла.»— Андрей Босый

eye-2771174_1920

Ладно, скажете вы, если искусственного интеллекта не существует, то чем тогда занимаются все те компании, которые заявляют о себе, что они создают АИ, нейросети и прочее?

В общем, очень большая часть того, о чем мы сегодня слышим — это Data science. Если говорить просто — Data science — наука, которая работает с данными, это использование имеющихся данных (часто это большие данные) и их анализ, для того, чтобы оптимизировать процессы принятия решений или решить определенные задачи, будь то в конкретной компании, или в обществе вцелом.

Важную роль в этом процессе играет также Data mining — это сбор данных и определение в этих данных особой ценности; понимание, как данные можно анализировать и использовать. Data science — непростая, но очень интересная наука, требующая знания статистики и программирования одновременно.

«Эксперт по Data science знает, как проанализировать данные, понимает, могут ли эти данные нести какую-то ценность, и знает, как эти данные следует использовать, а также решает, как устранять ошибки в данных, какие модели использовать, чтобы осуществить экстраполяцию результатов анализа этих данных на реальную ситуацию в мире, ведь далеко не всегда даже большие данные дают правильное представление о реальной ситуации. Для того, чтобы связать данные с реальностью применяются статические инструменты, формулы, теория вероятности, прикладная математика и многие другие знания. Датасаентист должен очень хорошо все это понимать и уметь из простых чисел добыть пользу, чтобы помочь клиенту получить реальную информацию, которая повлияет на его бизнес.«, — говорит Николай Козленко.

blur-1853262_1920

Миф 2. Нейросети — новый прорывной тренд. Системы, работающие по аналогии с нейронными связями в человеческом мозге.

Правда: Подход, которые лежит в основе нейронных сетей, появился в 50х-60х годах. И все это не имеет никакого отношения к тому, что происходит в нашей голове. Нейросети являются удобным механизмом, который на входе получает данные и классифицирует их, этот механизм можно обучать, он может показывать ошибки, которые он будет учитывать в дальнейшей работе, с помощью нейронных сетей очень удобно работать с данными таким образом, чтобы они хорошо переносились на реальную жизнь.

Существуют еще очень хорошие механизмы Deep Learning. В отличие от обычной нейросети, такая сеть сама способна выбирать классификаторы. Предположим, мы строим систему для поиска недвижимости и имеем набор параметров по каждому жилью: площадь, регион, наличие вблизи учебного заведения, и многие другие параметры. Мы можем указать системе, что на цену жилья влияют определенные конкретные параметры из выше перечисленных. А при применении Deep Learning система сама может выбрать из большого количества параметров и их значений те, которые будут необходимыми и оптимальными для работы с данными. Все это работает по заранее построенным алгоритмам.

Связи же в человеческом мозге работают хаотично и непостижимо. Соответственно, нейронные сети также не имеют никакого отношения к искусственному интеллекту.

«Нейросеть — это крутой классификатор и регрессор, но он не имеет отношения к тому, что происходит в мозге человека.» — говорит Николай Козленко

abstract-1392404_1920

Миф 3. Осталось еще несколько лет до того, как работы и механизмы смогут заменить большинство человеческих профессий, в результате чего возникнут глобальные проблемы с безработицей.

Правда: Работы и механизмы никогда не смогут заменить человека во множестве профессий, они не могут реагировать на резкие непредсказуемые изменения обстоятельств, не оптимально работают в неидеальных условиях, не говоря уже о творческих задачах. Да, они могут хорошо справиться с массовой рутинной работой, но они пока не являются надежными там, где существуют высокие риски для жизни и здоровья людей. Мы спросили Андрея Босого, сел бы он в самоуправляемый автомобиль, Андрей шутит: «Если бы мне дали Tesla, то я бы ее взял! Однако, если серьезно, то я не могу уверенно утверждать, что они безопасны, ведь такие машины хорошо работают при определенном наборе идеальных условиях: идеальное освещение, видимая разметка и дорожные знаки и тому подобное. Честно скажу, в нашем городе в вечернее время суток не поехал бы”.

Миф 4. Сегодня вокруг нас уже очень много решений в сфере АІ и Data Science, мы ими пользуемся каждый день.

Правда: Сейчас далеко не все задачи в этих сферах решены. Да, мы пользуемся поисковиками при помощи голосовых запросов. Однако, распознавание голоса сегодня еще очень далеко от идеала, ведь каждый человек разговаривает по-разному. Совсем частично решен также и вопрос распознавания изображений, ведь скажем даже при любом повороте изображения система уже не идентифицирует его как такое, которое мы искали. Самоуправляемые машины очень развились в последнее время, но они все еще довольно сильно зависят от идеальных условий на пути.

«В целом, сейчас в нашем деле существует своего рода дуализм: те задачи, которые интересны клиенту, которые необходимо решать, для них нет необходимого количества данных, или клиенты не хотят передавать эти данные для разработки, заботясь о безопасности данных своих клиентов. В то же время, есть задачи, которые очень трудно решить, а данных существует очень много. Например, распознавание текста: данных для анализа пруд пруди, а построить решение не всегда бывает просто. До сих пор для решения многих задач не хватает технической возможности компьютеров, ну и конечно, еще не найдено собственно путей, как это все можно решить. Перспективы и будущее Data Science просто неимоверные!«- Андрей Босый.

Несмотря на то, что мы сегодня немного изменили представление о таких популярных понятиях, как искусственный интеллект и нейросети, хотим рассказать о примерах интересных задач, которые сегодня активно решаются с помощью науки Data science:

-Распознавание звуков музыки, языка человека. Достижение эффекта, при котором компьютер может аккомпанировать человеку, когда тот играет на музыкальном инструменте.

audio-1839162_1920

-OCR. Распознавания рукописных текстов в старых архивных документах. Например, компания хранит архив разнотипных документов: это инвойсы, фактуры, уставы, договоры и прочее. Создается смарт-система, которая должна определить, что это за документ, какие данные он содержит, и поместить данные в электронном варианте в базу данных. Как это делается? Систему можно научить определять, в каком конкретно месте может типично находиться название документа или его номер, дата и т.д., или какие символы обычно содержит определенный тип информации, скажем, если это дата, то возможно она будет содержать символ «/». Сегодня уже удается достигать точности таких систем около 90%. Если раньше в компаниях были специальные люди, которые целыми днями выполняли сортировку документов и сбор информации с них вручную, то сегодня этого можно избежать.
Что сегодня удалось еще очень успешно реализовать в этой сфере — это распознавание штрихкодов, QR-кодов, которое имеет очень широкое применение.

stack-letters-447578_1920

-Планирование размещения солнечных панелей на крышах домов в зависимости от угла падения солнечных лучей на солнечные батареи.

-Визуальный подсчет количества людей, которые в течение дня заходят и выходят из магазина, определение и анализ набора характеристик этих посетителей.

-Анализ спутниковых снимков крыш зданий для определения наличия или отсутствия солнечных батарей на крышах домов, для лидогенерации для компании, продающей солнечные батареи.

-Нейросети в мобильных приложениях для eCommerce, которые анализируют продолжительность просмотра пользователем того или иного товара и мгновенно решают, какой товар оптимально показать следующим, чтобы он был интересным именно для этого конкретного пользователя.

-Смарт мерчендайзинг: анализ поведения покупателей, тенденций продаж, их причин, прогнозирование на основании отслеживания результативности продаж товара в зависимости от его размещения на полках.

-В мире ведутся попытки создать системы, которые отличали бы фейковые новости от настоящих.

The Young Pope«, который отслеживает комментарии в социальных сетях и реагирует на них фразами из Библии.

-Разработка модели для определения точной рыночной стоимости объектов недвижимости. Благодаря разработанному алгоритму проводится анализ сотен статических и динамических параметров каждого объекта недвижимости (как измеряемых: площадь, расположение, так и неизмеряемых: цвета, наличие солнечных панелей, качество мебели и др.). Анализируется динамика рынка и история продаж в регионе. Разработанная модель дает точную оценку стоимости недвижимости в 95% случаев, фактически так, как бы это сделал эксперт по недвижимости.

-Диагностирование онкологических заболеваний на основе анализа больших объемов данных магнитно резонансной томографии и формирование следующих рекомендаций пациентам.

-Глубокий анализ социальных сетей для реализации эффективных коммуникационных диджитал стратегий.

-Поиск закономерностей, взаимосвязей в истории продаж (по чекам, годах, товарам, группам товаров) и построение моделей для прогнозирования влияния изменений определенных параметров на продажи.

-Анализ поисковых запросов пользователей и адаптация сайтов под пользователя в режиме реального времени.

Это лишь мизерная часть того, с чем уже сегодня работают датасаентисты. Если вам или вашим клиентам интересна тематика Data Science, если есть потребность в новых подходах в работе с данными, специалисты компании [bvblogic] предоставят рекомендации и помогут построить эффективные модели для монетизации этих данных. Вы можете получить бесплатную консультацию уже сегодня, и узнать какие скрытые возможности открывают для вас данные! Не сомневайтесь, напишите нам.

analytics-3088958_1920

Sorry! The Author has not filled his profile.

Компания Clutch объявляет bvblogic лидером отрасли в Украине!

«Для нас большая честь быть включенными в список «Лидеров Clutch в Восточной Европе». Удовлетворение потребностей клиентов является одной из основных целей компании, поэтому мы рады предоставить нашим клиентам качественные услуги». — Виталий Родымюк, Генеральный директор,…

Как происходит процесс рекрутинга в ИТ-компании

Как происходит процесс рекрутинга в ИТ? Какие задачи стоят перед рекрутером? Какими навыками должен обладать кандидат, чтобы привлечь внимание рекрутера? Ниже вы найдете ответы на все эти вопросы. Технические исследования показывают, что только с должными…

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *