Большие данные (англ. Big data) – информация, объемы и формат хранения которой затрудняют ее обработку традиционными способами, а также набор подходов и методов, разработанных для ее анализа. Большие данные часто описывают тремя характеристиками: объем, скорость (прироста и требуемой обработки) и многообразие (различные типы данных).
Технологии обработки больших данных стали широко применяться в 2000-х годах, ведь именно тогда появились технические возможности для того, чтобы собирать, хранить и обрабатывать большие объемы информации. Источниками больших данных могут служить базы статистической информации, социальные сети, системы видеорегистрации, данные мониторинга и самых различных наблюдений.
Для анализа больших данных применяются статистический, кластерный и регрессионный методы, используются машинное обучение и искусственные нейронные сети. Часто для обработки таких данных привлекают добровольцев. Иногда в обработку больших данных включают также представление результатов анализа в удобном для восприятия формате (визуализация, инфографика и т.д.).
Критики использования больших данных отмечают, что для прогнозов или объяснения закономерностей их можно использовать лишь ограниченно. Результат сильно зависит от моделей, которые применяют для анализа.
Фото: Jim Kaskade/Flickr