Data science быстро развивается — одновременно растет число ресурсов, которые пишут на эту тему. Для того, чтобы быть в курсе последних трендов и исследований, приходится читать много источников, ориентироваться в которых сложно.
По совету наших R&D-специалистов составили подборку источников с качественной и проверенной информацией: кейсами, проблемами и их решениями. Подборка подойдет как специалистам, так и широкой аудитории — тем, кто хочет разобраться, как устроена наука о данных.
Из-за специфики отрасли почти все блоги, каналы и СМИ в этой подборке — англоязычные. Наши дата-сайентисты посоветовали несколько русскоязычных источников: у них есть соответствующие пометки.
● Machinelearning — самая актуальная информация из мира машинного обучения и нейронных сетей.
● Gonzo_ml — русскоязычный канал Григория Сапунова и Алексея Тихонова из Яндекса с гонзо-обзорами научных статей о машинном обучении. Посты написаны простым языком, но ориентированы на специалистов, а не на широкую аудиторию.
● DL in NLP — новости и обзоры статей на тему нейросетей и обработки естественного языка (Natural Language Processing). Канал ведут участники исследовательского проекта DeepPavlov – открытой библиотеки для разговорного искусственного интеллекта, которую разрабатывают в МФТИ.
● Data Science Notes — авторы советуют полезные ресурсы: книги, статьи, материалы в области data science.
● Data root labs — новости о data science и искусственном интеллекте, новые разработки и инструменты, которые появляются в этих дисциплинах. Уровень — средний и выше: канал ориентирован на профессионалов, а не на широкую аудиторию.
● Data Kitchen — сравнительно молодой канал дата-сайентиста Антона Ложкова, члена R&D-команды нашей компании. Освещаются последние исследования в областях обработки естественного языка (NLP) и компьютерного зрения.
● iggisv9t channel — канал о машинном обучении с визуализациями и скриншотами из твиттера.
● @seb_ruder — исследователь Себастьян Рудер из DeepMind доступным языком рассказывает о машинном обучении и обработке естественного языка, а также советует ресурсы для самообразования в этих областях.
● @soumithchintala — инженер Facebook AI Research и создатель библиотеки PyTorch для Python Сумит Чинтала пишет об анализе данных, машинном обучении и новых трендах в разработке искусственного интеллекта.
● @randal_olson — главный научный сотрудник FOXO BioScience Рэндал Олсен специализируется на искусственном интеллекте, машинном обучении и визуализации данных.
● @goodfellow_ian — аккаунт Иэна Гудфеллоу, изобретателя генеративно-состязательных нейросетей и одного из самых влиятельных деятелей в IT-отрасли по версии журнала Foreign Policy.
● @hardmaru — научный сотрудник Google Brain Дэвид Ха анализирует новости о искусственном интеллекте и рассказывает о новых разработках в этой области.
● @fchollet — блог Франсуа Шалле, французского инженера и автора фреймворка Keras, об этике использования ИИ и обработки больших данных.
● @karpathy — Андрей Карпати, глава ИИ-подразделения автопроизводителя Tesla, пишет о глубоком изучении, нейросетях, технологии компьютерного зрения и анализе данных.
● @thom_wolf — сооснователь и глава одного из самых авторитетных компаний в сфере data science Hugging Face пишет о машинном обучении и компьютерной лингвистике для специалистов среднего уровня.
● KDNuggets — крупнейший ресурс о науке о данных, где собраны знания для всех уровней: от начинающих специалистов до профессиональных инженеров. Куратор проекта — Георгий Пятницкий-Шапиро, один из идеологов Data Mining.
● Indico — внедрение data science-решений на примере конкретных кейсов, рассказанных компанией-разработчиком. Посты в блоге написаны простым языком и будут понятны неспециалистам.
● OpenAI Blog — блог одного из наиболее успешных некоммерческих проектов в области исследований искусственного интеллекта. Инженеры компании публикуют статьи с описанием своих работ на языке, понятном широкой аудитории.
● Dataconomy — блог с новостями о data science, машинном обучении, искусственном интеллекте и big data. Авторы описывают влияние данных на бизнес и повседневную жизнь простым языком с понятными примерами.
● IBM Hub — блог одной из крупнейших компаний на рынке, авторы которого рассказывают о различных проблемах с данными, которые возникают при их сборе, хранении и использовании.
● Randal S Olson — блог упомянутого выше Рэндала Олсена из FOXO BioScience, только уже на собственном сайте. Статьи предназначены для профессионалов, но некоторые будут понятны и новичкам.
● DeepMind — блог подразделения Google, которое специализируется на исследованиях искусственного интеллекта. Статьи написаны простым языком, но ориентированы на тех, кто уже погружен в тему.
● Salesforce Research — блог data science-команды компании Salesforce, который ориентирован на крупный бизнес. Главная задача авторов — помочь разобраться с данными, накопленными внутри компании, и другими проблемами, которые снижают эффективность внедрения data science-решений. Статьи написаны языком, понятным широкой аудитории.
● Allen Institute — блог некоммерческого исследовательского института, который занимается исследованием проблем искусственного интеллекта. Чаще всего можно встретить статьи с аналитикой и оценкой тенденций рынка ИИ и data science. Блог будет полезен владельцам бизнеса и тем, кто интересуется развитием технологий.
● Ayasdi — корпоративный блог о внедрении новых технологических решений в разные отрасли бизнеса с успешными примерами использования ИИ для автоматизации рутинных процессов в компаниях. Статьи рассчитаны на широкую аудиторию.
● Calculated content — блог одноименной консалтинговой компании, специализирующейся на компьютерных данных. Основной контент — исследования и аналитика в области внедрения data science и искусственного интеллекта.
● Element AI — блог с описанием конкретных кейсов внедрения искусственного интеллекта в разные отрасли бизнеса: от страхования и бухгалтерии до электронной коммерции. Статьи предназначены для широкой аудитории, но будут полезны и разработчикам.
● Borealis AI — блог организации, основная деятельность которой заключается в фундаментальных научных исследованиях машинного обучения. Статьи предназначены для среднего уровня знаний и рассказывают о новых инструментах, связанных с искусственным интеллектом и data science.
● Data Science Weekly — аналог KDNuggets. База знаний о data science и еженедельная почтовая рассылка с дайджестом новостей и обновлений.
● NLP News — еще один еженедельный дайджест с новостями об обработке естественного языка (NLP) высокого качества.
● Edwin Chen — блог исследователя Эдвина Чена о математических моделях, нейросетях и статистике применительно к науке о данных.
● Hunch — ресурс о теории машинного обучения. Подходит для тех, кто хочет глубже разобраться в механизмах работы искусственного интеллекта и data science.
● Open Source Data Science Masters — блог, в котором публикуются курсы и методические материалы для дата-сайентистов. Учебные планы подходят в качестве дополнения к основному образованию и рассчитаны на средний уровень знаний.
● Kaggle Newsletter — статьи с обзорами исследований и новостей о машинном обучении. В разделах Awesome и Not Awesome собраны краткие заметки о новых исследованиях, чтение каждой из которых занимает примерно минуту. У блога более 40 тысяч подписчиков, основная аудитория — профессиональные дата-сайентисты.
● The Spectator by Shakir Mohammed — блог Шакира Моххамеда, исследователя в области статистического машинного обучения и искусственного интеллекта в Google DeepMind. Инженер рассматривает междисциплинарные проблемы статистики, машинного обучения и вычислительной науки, которые возникают при разработке data science-решений.
● R-Bloggers — блог о языке R, который используется в качестве стандарта при разработке статистического программного обеспечения. Ресурс рассчитан на специалистов.
● Huggin Face — блог небольшой, но очень влиятельной в мире data science компании, ориентированной на научные исследования.
● Data Driven Journalism — специализированное издание, которое рассказывает о использовании науки о данных в журналистике. Помимо статей, публикует курсы и книги по data journalism.
● Medium — о новых разработках, кейсах и опыте экспертов для новичков, так и профессионалов.
● InformationWeek — издание об IT-индустрии для начинающих инженеров и профессионалов с сильной рубрикой об анализе данных.
● GCN — издание о внедрении искусственного интеллекта и data science в государственные структуры.
● TechCrunch — одно из главных СМИ о технологиях с сильной рубрикой о data science.
● InfoWorld — статьи о Data Science и машинном обучении, которые написаны с точки зрения использования разных языков программирования для решения тех или иных задач.
●Dataconomy — новости о больших данных, искусственном интеллекте и машинном обучении.
● InfoQ — издание о data science для дата-сайентистов. Обзоры новых инструментов и технологий в машинном обучении, систем для анализа и очистки данных.
● Analytics Magazine — издание о data science и искусственном интеллекте в контексте крупного бизнеса. От особенностей внедрения до новых решений на рынке.
Подборка будет обновляться. Если вы нашли интересный ресурс о data science, машинном обучении или обработке естественного языка, напишите нам на почту info@embedika.ru — мы добавим ссылку в материал.
В ближайшее время наш менеджер свяжется с Вами.