Еженедельный информационный бюллетень D4S №90
ВОПРОС №90
Еженедельный информационный бюллетень с последними новостями в области науки о данных, машинного обучения и искусственного интеллекта.
14 февраля 2021 года
Дорогие друзья, добро пожаловать в выпуск информационного бюллетеня, посвященного Дню святого Валентина.
На этой неделе у нас две новые статьи в блоге. На странице Graphs For Data Science мы только что опубликовали статью: Сети слов для генерации языка, в которой мы исследуем сеть английского языка и показываем, как легко создать систему предиктивного текста, подобную той, которая есть на вашем смартфоне. Вы должны подписаться на G4Sci, чтобы не пропустить ни одной статьи!
Мы также возобновили серию статей о причинно-следственных связях с публикацией, посвященной разделу 3.7 — Медиация и процедуре вычисления причинных эффектов при наличии промежуточных переменных. Вы также можете ознакомиться с нашей недавней статьей о соревновательных штаммах CoVID-19, а также найти код в репозиториях Epidemiology и Causality на GitHub.
На этой неделе мы узнаем, как ускорить обучение моделей Scikit-Learn, как Lyft обнаружил, что OpenStreetMap является самой актуальной картой для пассажирских перевозок и кратко рассмотрим основы парсинга веб-страниц с помощью Python.
Из мира науки у нас есть статьи о суперраспространяющихся геномах, понимании коллективного человеческого движения и обзоре моделирования распространения и контроля инфекционных заболеваний в социальных сетях контактов.
Наконец, книгой недели в области науки о данных является книга Аллена Б. Дауни "Думай статистически" (Think Stats), а в видео недели мы предлагаем учебное пособие по обнаружению сообществ в сетях как кластеров.
Данные показывают, что лучший способ для роста рассылки - это рекомендации от уста к устам, поэтому, если вы считаете, что одному из ваших друзей или коллег понравится этот бюллетень, просто перешлите им это письмо. Это поможет нам распространить информацию!
Semper discentes,
Команда D4S
Блог:
Последний пост на подписке Graphs for Data Science: Сети слов для генерации языка уже вышел. В этом посте мы используем набор данных Google Books n-gram для изучения связей между словами в английском языке и того, как их можно использовать для предсказания текста. Вы должны Зарегистрироваться, чтобы не пропустить ни одного поста!
Последний пост в серии о причинно-следственных связях охватывает раздел ‘3.7 — Медиация’, рецепт для расчета контролируемого направленного эффекта. Код для каждого поста в этой серии размещен в отдельном репозитории GitHub: https://github.com/DataForScience/Causality
Последний пост в серии CoVID-19, ‘Соревнование мутаций CoVID-19’ рассматривает возможное влияние появления более вирулентного штамма на ход пандемии. Как обычно, весь код доступен на GitHub: http://github.com/DataForScience/Epidemiology101
Книга по Data Science:
Книга по Data Science на этой неделе - "Think Stats" Аллена Б. Дауни. Несмотря на естественную тенденцию восхищаться последними моделями и алгоритмами, правда в том, что большая часть работы Data Scientist является намного более основной и фундаментальной. Наличие прочной основы в традиционной статистике является важным условием успешной карьеры в области Data Science. Think Stats использует эмпирический подход, который помогает вам полностью и истинно понять вводимые концепции. Используя примеры на Python и подробные объяснения, Дауни проводит читателя через важные концептуальные инструменты, такие как вероятностные распределения, проверка гипотез, регрессия и анализ выживаемости, которые должны быть в арсенале каждого практика.
Топ ссылки:
Учебники и блоги, которые попали к нам на стол на этой неделе.
Свежие новости:
Некоторые из самых интересных академических статей, опубликованных недавно.
- Прогнозирование активности гриппа с использованием машинного обучения карты мобильности (С. Венкатраманан, А. Садилек, А. Фадикар, К. Л. Барретт, М. Биггерстафф, Дж. Чен, Х. Дотивалла, П. Иствуд, Б. Гипсон, Д. Хигдон, О. Кучуктунч, А. Либер, Б. Л. Льюис, З. Рейнольдс, А. К. Вулликанти, Л. Ванг, М. Марат)
- Геномы сверхраспространителей (С. Ализон)
- Отслеживание контактов, находим себя (Н. Насир, К. Стрелау)
- Социальное заражение в мире с асимметричным влиянием (Г. С. Халворсен, Б. Н. Педерсен, К. Снеппен)
- Понимание динамики коллективного движения людей во время крупномасштабных событий с использованием аналитики больших геосоциальных данных (Дж. Фан, К. Стюарт)
- Обзор моделирования распространения и контроля инфекционных заболеваний на социальных контактных сетях (М. Шахзамал, С. Хан)
Видео недели:
Интересные обсуждения, идеи или учебники, которые попали к нам на стол.
Обнаружение сообществ как кластеров
Все видео недели теперь доступны в нашем плейлисте на Youtube.
Предстоящие события
Возможности учиться у нас:
Спасибо за подписку на нашу еженедельную рассылку с кратким обзором мира Data Science и Machine Learning. Пожалуйста, поделитесь с вашими контактами, чтобы помочь нам расти!
Опубликовано в воскресенье.
© 2021 Data For Science, Inc, Все права защищены.