CNews:В течение месяца на CNews шла открытая онлайн-дискуссия о Big Data. Предлагая трактовки термина «большие данные», кто-то акцентировал внимание на масштабируемости, другие на объеме данных, третьи на новых подходах к управлению бизнесом, которые за собой влечет применение этих технологий. Поделитесь вашим определением больших данных.
Эндрю Сазерленд: Для меня в Big Data первостепенное значение имеет конечный результат, а не сами технологии. Большие данные позволяют извлекать пользу из данных, которые казались мусором. При этом данных не обязательно должно быть много. Важнее, что в них может скрываться ценная информация, которую невозможно извлечь классическими методами. Если вы обнаружили неочевидную ранее пользу от данных, вы решили задачу класса Big Data. И не важно, какие вы применяли при этом технологии. Полученная выгода здесь важнее всего.
CNews: Некоторые полагают, что через пару лет мы больше не будем использовать термин «большие данные», потому что скоро все данные будут большими. Вы согласны с этим?
Эндрю Сазерленд: Термины приходят и уходят, особенно в сфере ИТ. И, конечно, все данные будут большими. Однако очевидно, что нам будет удаваться извлекать все больше выгоды из данных. И чтобы определить эту тенденцию, новый термин нам обязательно пригодится.
Мы будем анализировать исторические данные, чтобы предугадать ближайшее будущее. И благодаря этому любые наши действия будут становиться гораздо более эффективными. Мы будем меньше тратить времени впустую на работу, которая не приносит эффект. Мы сможем лучше прогнозировать, какие продукты и на каких рынках будут продаваться, какие услуги будут наиболее востребованы нашими клиентами. Возможно, мы будем называть эти новые возможности Big Data, а может быть и нет.
CNews: Вы обрисовали картину, как изменится будущее для бизнеса. Как, по вашему мнению, большие данные могут изменить жизнь обычного человека?
Эндрю Сазерленд: На протяжении всей истории человек ищет способы повысить эффективность своего труда. И на помощь всегда приходили технологии. Например, трактор повысил эффективность земледелия. Грузовики стали перевозить гораздо больше грузов, чем это делали животные. И так во всех областях нашей жизни. Эффективны ли мы сегодня настолько, насколько могли бы быть? Конечно, нет. Люди, работающие в самых разных сферах, до сих пор тратят впустую очень много времени.
Например, типичный уровень конверсии, когда возможность продать продукт или услугу реализуется в реальной покупке, составляет порядка 30-40%. Представьте, что вы могли бы повысить конверсию до 100% и не тратить время на общение с теми, кто точно не купит ваш продукт, благодаря качественному выявлению своей целевой аудитории. Это выгодно и продавцу, и покупателю.
Например, в магазин в аэропорту одновременно входят 3 человека. Продавцу надо выбрать, к кому подойти, зная что двое других после этого скорее всего уйдут. На одном из покупателей одежда этого бренда, на другом одежда конкурирующего бренда, третий выглядит неряшливо. Продавец делает случайный выбор, возможно, верный и он увенчается продажей, а, возможно и нет. Это не эффективный подход, мы тратим зря время. А теперь предположим, что в распоряжении продавца есть технологии Big Data, которые подсказывают, что люди, которые носят джинсы конкурента, с вероятностью 90% купят его товар.
Или другая сторона медали – большие данные помогают масштабировать опыт. К примеру, вы – пациент, идете в больницу и хотите, чтобы вас осматривал опытный врач: может, он уже встречался с таким заболеванием, знает симптомы и знает эффективное лечение? Или вы пригнали машину на станцию техобслуживания, а вас встречает очень молодой парень, и вас настораживает возможное отсутствие у него опыта. Большие данные могут предоставить в распоряжение специалиста именно накопленные знания, опыт других людей. Представьте энергичного 23-летнего хирурга со знаниями опытного врача. Или оператора контакт-центра, обладающего столетней экспертизой и знающего опыт тысяч предыдущих звонков. Большие данные позволят нам передать мудрость и опыт молодому поколению.
Эндрю Сазерленд: Мы хотим, чтобы люди узнали и поняли, что такое большие данные, и могли эффективно применять это знание
Итак, если мы посмотрим, что нам дали технологии в прошлом, то увидим, что они сделали нас сильнее и быстрее. Нам нужно было больше физической силы, чтобы добыть еды, угля, и мы ее получили. Сегодня наша проблема не связана с ресурсами. Главными проблемами стали сохранение окружающей среды, политика, управление бизнесом. Технологии нужны для расширения умственных возможностей. Большие данные помогают принимать правильные решения практически во всех сферах человеческой деятельности. И это может сильно повлиять на каждого из нас.
CNews: В исследовании, проведенном Oracle в начале 2013 года, говорилось, что и в Европе, и в России технологиям больших данных не придавалось большого значения. Как изменилась ситуация с тех пор?
Эндрю Сазерленд: Она изменилась очень-очень сильно. Такое случается. Когда предприятия начинают получать реальный результат для бизнеса от новых технологий, рынок узнает об этом очень быстро. Многие организации сейчас понимают, что Big Data – это большое конкурентное преимущество, которое позволяет очень быстро и с высокой точностью определить, во что стоит инвестировать деньги и время. Способность точного прогнозирования незамедлительно увеличивает маржинальность бизнеса и влияет на прибыль. Именно способность создавать маржу очень быстро внушает бизнесу уверенность в новых технологиях. Oracle в ходе проектов во многих компаниях уже продемонстрировал, как быстро технологии больших данных увеличивают маржу и создают новые конкурентные преимущества.
CNews: Какой вы находите ситуацию в России?
Эндрю Сазерленд: Я вижу огромный потенциал для применения технологий больших данных в России. Клиенты, с которыми я общаюсь, обладают глубоким пониманием преимуществ использования Big Data. Одновременно здесь много профессионалов в статистике и аналитике. Я чувствую, что рынок сделал глубокий вдох перед тем как начать действительно серьезные инвестиции в Big Data.
CNews: Как текущий кризис может повлиять на спрос на технологии Big Data?
Эндрю Сазерленд: Трудности зачастую способствуют внедрению инноваций. Бизнес постоянно сталкивается с теми или иными вызовами, участвуя в конкурентной борьбе или осваивая новые рынки. Во время «турбулентности» у бизнеса всегда появляются новые возможности занять лидирующие позиции. И сегодня есть предприятия, которые будут использовать кризис в своих интересах. Полагаю, что многие из них обратятся к большим данным для получения конкурентоспособного преимущества.
CNews: Каким вы видите следующий этап развития технологий для работы с данными после Big Data?
Эндрю Сазерленд: Нам предстоит долгий путь. Когда-то я собирался стать стоматологом, но в последний момент, за три недели до выпуска, в нашей школе появился компьютер Apple, я изменил решение и начал изучать компьютерные технологии.
ИТ – как известная певица Мадонна – постоянно обновляются. Сегодня, проработав более 30 лет в этой сфере, я понимаю, на какой ранней стадии развития компьютерных технологий мы находимся. Да, многие процессы автоматизированы, но мы только прикоснулись к мобильным и социальным технологиям.
Работники умственного труда сегодня так неэффективны! Мы часто делаем работу, которая уже сделана до нас. Мы отвечаем на вопросы, на которые уже есть ответы. Если бы я имел доступ к этой информации, я бы не тратил время на то, что было сделано до меня. Технологии делают нашу жизнь более продуктивной.
Я вижу большой потенциал за Интернетом вещей. Мы начинаем использовать информацию об окружающих нас объектах. Например, мой дом отслеживает мое местоположение по телефону. Сейчас в нем отключено отопление. Когда завтра я приземлюсь в аэропорту Хитроу и поеду в свой дом в Оксфорде, по мере моего приближения температура будет повышаться и к моему приходу достигнет оптимального значения. Это возможно благодаря анализу исторической информации о том, как быстро остывает и нагревается дом в зависимости от погоды на улице.
Если говорить о здоровье, одежде, лекарствах, то технологии будут знать все о нашем теле: когда принимать лекарства, какие, как они на нас влияют. У нас будут сенсоры, которые показывают, что вредно, а что полезно, основываясь на больших данных.
Если не касаться области применения технологий, а посмотреть на сами технологии, то они помогут нам быстрее справляться с большими данными. Если мы заставим чипы работать быстрее и «положим» софт в кремний, то увидим совсем другой уровень, необходимый для больших данных.
Продолжится распространение облачных технологий. Мы сможем контролировать данные и обезопасить их. Усилится интеграция различных технологических стеков. Мне бы не хотелось выделять отдельные направления. Я думаю, применение всех существующих технологий даст необходимые преимущества.
CNews: Oracle объявила «Год Big Data в России». Каковы ваши ожидания от этой акции?
Эндрю Сазерленд: Организации таких масштабов как Oracle ощущают ответственность за распространение знаний об эффективных технологиях, которые создают добавочную стоимость. Этот процесс происходит в общих интересах. Мы хотим задать вектор для внедрения лучших практик и таким образом способствовать развитию рынка и более широкому применению Big Data.
Мы хотим открыто общаться, не просто транслировать информацию, а взаимодействовать. Мы хотим, чтобы люди узнали и поняли, что такое большие данные, и могли эффективно применять это знание.
Наши решения для работы с большими данными не перечеркивают все созданные ранее технологии, а наоборот – дают новые возможности давно зарекомендовавшим себя решениям. Oracle Big Data SQL позволяет интегрировать данные разных типов – классические и большие – и выполнять один SQL-запрос к данным, содержащимся в Hadoop, NoSQL и Oracle Database. Нельзя, чтобы большие данные были изолированы от общей информационной среды компании. Поэтому наш программно-аппаратный комплекс для Big Data может работать в связке с Oracle Exadata. И мы рекомендуем клиентам такое совместное использование.
Совсем недавно мы выпустили шестое поколение наших оптимизированных программно-аппаратных комплексов Oracle Engineered Systems. Среди них Oracle Exadata X5 с повышенной общей производительностью и сервером храния данных на базе флэш-памяти, а также Oracle Big Data Appliance X5 c удвоенным объемом оперативной памяти и новейшей версией Oracle Big Data SQL.
CNews: Мы предложили читателям CNews задать свои вопросы в рамках этого интервью. И владелец онлайн-магазина детских товаров спрашивает: доступны ли технологии больших данных для его небольшого бизнеса. Он хочет отслеживать поведение пользователей на его сайте, чтобы делать персонализированные предложения, но не имеет большого бюджета и штатных ИТ-специалистов.
Эндрю Сазерленд: Конечно, большие данные доступны и для малых предприятий. Мы, как вендор, сейчас активно развиваем свои технологи, в том числе Big Dаta, в формате облачных сервисов. Это очень эффективный путь потребления ИТ для крупных организаций, но он также и открывает дорогу к новейшим технологиям для небольших бизнесов. Я знаю много компаний, которые предоставляют как раз такие сервисы, о которых спрашивает ваш читатель: они отслеживают трафик веб-сайтов и анализируют его, чтобы делать пользователям релевантные рекомендации.
CNews: Много вопросов наших читателей связано с объемом данных: насколько велика Big Data? Скажем, 60 ГБ – это большие данные или нет?
Эндрю Сазерленд: Это зависит от того, спрятана ли в этих данных ценная информация, которая не может быть извлечена традиционными способами. Например, эти 60 Гб представляют собой информацию о потреблении топлива различных видов транспорта, двигающегося по разным маршрутам, чтобы доставить товар к вашему магазину. В случае, если анализ этих данных позволяет узнать, какой вид транспорта, маршрут или даже водитель оказывается наиболее эффективным, то это Big Data. Извлечение скрытой информации, которую не получить при помощи простого запроса, может помочь повысить доходность ваших активов.
CNews: Помимо повышенного интереса, обсуждение больших данных также сопровождается изрядной долей скепсиса. Некоторые за словом Big Data видят исключительно маркетинговый ход. Что бы вы ответили на это?
Эндрю Сазерленд: Большие данные обладают огромным потенциалом в очень разных направлениях нашей жизни, могут сделать ее лучше и эффективнее. Очень жаль, если скепсис замедляет распространение этих технологий. Но я надеюсь, что этого не происходит. Большие данные позволяют получить ценную информацию намного дешевле и быстрее, чем раньше. У нас есть четкое понимание того, что эти технологии могут принести в разных сферах – от медицины до продаж, поэтому я надеюсь, что любые сомнения по поводу Big Data скоро сойдут на нет.
CNews: К какому стеку технологий вы относите большие данные: хранение, обработка, аналитика?
Эндрю Сазерленд: Все это и сверх того. Вы, наверное, заметили, что всё интервью я пытаюсь уйти от разговора об отдельных компонентах технологий больших данных. Я склонен определять Big Data как подход, который несет с собой эффективность. С одной стороны, на поверхности лежит разрозненная информация, которая не имеет никакой ценности на первый взгляд. С другой, мы получаем инструмент, который позволяет нам сделать наш бизнес более эффективным, то, что между, мы называем большими данными. Технологии, которые мы используем сегодня для хранения или обработки информации, могут измениться через какое-то время, но это не имеет значения. Важно, что мы имеем на входе и получаем на выходе.
CNews: Мы рады видеть вас снова в Москве, вы нередко приезжаете. В то же время в некоторых странах Европы вы бываете раз в несколько лет, а то и реже. Отсюда вопрос – почему вы снова в Москве? Проблемы или большие перспективы?
Эндрю Сазерленд: Как я уже сказал, Москва имеет огромный потенциал. Но более того, я вижу очень высокий уровень образования. Я заметил в разговорах с покупателями и прессой отличия от других стран в уровне понимания технологий, математике и статистике. Уровень очень высокий, и он повышается. Комбинация большого потенциала и глубоких знаний о том, как его реализовать приближают к достижению цели. Я уверен, что в вашей стране технологии, которые мы создаем в Oracle, могут найти чрезвычайно эффективное применение на благо российской экономики. И мне очень приятно наблюдать за тем, как идет этот процесс.
История о том, как построить конкурентоспособную бейсбольную команду, несмотря на отсутствие больших финансовых возможностей, но с помощью анализа нужных данных.
«Человек, который изменил все» (Money ball)