Big Data и неочевидные связи

@ 10.05.2016

Еще одно значительное достижение нашего времени - Big Data. Этот термин появился из-за возникновения на основе повсеместной информатизации гигантских (исчисляемых петабайтами) массивов однородной информации, собираемой в течении длительного периода времени.

Все дело именно в цифровом формате. И ранее, за десятки лет накопаливалось огромное количество информации, но вся она была исключительно в бумажном виде и каким либо образом ее обобщить, проанализировать, найти взаимосвязи было фактически невозможно.

В связи с началом массового использования баз данных, структурирования информации, возможности выделения ключевых признаков в формате "ключ-значение" позволило проводить совершенно произвольную выборку из массивов данных, собранных к примеру за несколько лет.

Администраторами подобных массивов оказались банки, страховые компании, авиаперевозчики, операторы торговых сетей, мобильные операторы, логистические компании - там где ежесекундно формируется огромное количество однородной информации.

На основе анализа Big Data можно выделять сезонность, потребительские предпочтения различных фокус-групп, создавать и просчитывать различные вероятностные прогнозы, и что самое главное находить неочевидные связи.

Неочевидные связи - это зависимости, которые нельзя найти и определить путем простого анализа. Для поиска неочевидных связей необходимо найти зависимость признаков, которые напрямую друг с другом не коррелируют или мы не можем увидеть их корреляцию в связи с отсутствием информации. Например, что менеджеры по продажам по имени Александр в возрасте 32 лет, как правило, ездят на машинах марки Volvo синего цвета, или предпочитают в ноябре летать на Бали.

Для кого-то эта аналитическая выборка представляет собой бесценный материал для работы, а для кого-то - ничего не значащий мусор. Ценность Big Data в том, что это просто огромные кучи песка, которые с каждой секундой увеличиваются в размерах. Сами по себе эти кучи ничего полезного не представляют, что бы получить внятные и полезные результат, нужно еще совершенно четко понять - что же мы хотим узнать и получить в результате и как это будем использовать. После этого нам предстоит определить каким образом на соорудить такое сито, которое будет отлавливать только те закономерности и данные, которые нам нужны.

И несмотря на то, что звучит все это достаточно просто, в реальности построить подобные алгоритмы обработки данных Big Data не так уж и просто. Все это требует времени, средств и экспертного подхода, и даже выводы могут быть неочевидны и их будет необходимо проверять на практике.

Таким образом, сама сущность Big Data это не прорыв наверх, а всего лишь непаханное поле разнообразных данных, которое позволяет исключительно при грамотном подходе получать материал для принятия бизнес-решений таким путем, какой ранее для корпоратвиного сектора был просто недоступен в принципе.

comments powered by Disqus










Государство Общество Власть