Что такое векторизация текста в NLP и какая она бывает: One-hot encoding, Bag of words, TF-IDF, Word2Vec, BERT и другие
https://ift.tt/5u9Wolk
Расскажу про разные способы векторизации текстов. Эту статью я напишу нетехническим языком, потому что сам не технарь и не математик. Надеюсь, что она поможет узнать о NLP тем, кто не сталкивается с AI в продуктах на ежедневной основе.
Сводка от pythonz net 02.06.2024 — 09.06.2024
https://ift.tt/G7ZRmSV
А теперь о том, что происходило в последнее время на других ресурсах.
#python #pydigest
IT-новости про Python перед вами.
Часть материалов из выпуска Python Дайджест:
- Celery: разбираемся с Celery Beat
- Не статья, а позорище какое-то! Sentiment-анализ комментариев из блога
- Как я создавал аудиоплеер на python с FFmpeg
- Получение списка людей посещающих определенные места
- Enbeddrus — обучение независящей от языка эмбеддинг-модели
- Как автоматизировали тестирование SAP ERP с помощью Python
- django-mfa2
- sentry-sdk - 2.5.0
- django-haystack - 3.3.0
Заходите в гости - https://pythondigest.ru/issue/547/
Простая имитационная модель мобильного робота в ROS и Gazebo
https://ift.tt/12yMzwx
В данной работе представлен процесс разработки и симуляции мобильного робота с использованием платформы ROS Noetic и среды Gazebo. Описано создание URDF-модели робота, которая включает в себя детальное описание всех его компонентов. Рассмотрена разработка Docker контейнера, что позволяет обеспечить унификацию и воспроизводимость среды разработки.
Получение списка людей посещающих определенные места
https://ift.tt/vjtIV5Q
Представьте: вы ведете Telegram-канал о животных и хотите пригласить в него посетителей зоопарка. Или вам нужно собрать контакты потенциальных клиентов, посещающих определенный торговый центр. Как это сделать?
pylint - 3.2.3
https://ift.tt/YqpEV3d
Статический анализатор Python-кода. Скачать можно по ссылке: https://pypi.python.org/pypi/pylint/
Как я создавал аудиоплеер на python с FFmpeg
https://ift.tt/b0yHU5s
Сегодня хочу поделиться опытом создания своего первого проекта на Python. Мой проект — это простой аудиоплеер, и я хочу рассказать, как я его создавал, с какими сложностями столкнулся и что из этого вышло.
Майним крипто-коины с помощью Python и компьютерного зрения
https://ift.tt/lojfNCa
После внезапного обогащения энтузиастов, которые поиграли в начале года в приложение Notcoin в телеграм, подобные проекты стали расти как грибы. Да и грибников заметно по прибавилось. Но в данной статье мы не будем касаться тем блокчейна или финансов, а рассмотрим простой пример применения компьютерного зрения для фарма поинтов в самом популярном, после Notcoin, проекте.
pymongo - 4.7.3
https://ift.tt/yAFEhNv
Python интерфейс для MongoDB. Скачать можно по ссылке: https://pypi.python.org/pypi/pymongo/
pytest - 8.2.2
https://ift.tt/foV3BU4
Простой мощный инструмент тестирования в Python. Скачать можно по ссылке: https://pypi.python.org/pypi/pytest/
Мега-Учебник Flask Глава 11: Дизайн приложения (издание 2024)
https://ift.tt/y7bFmS4
Это одиннадцатая часть серии мега-учебника Flask, в которой я собираюсь рассказать вам, как заменить базовые HTML-шаблоны новым набором, основанным на платформе пользовательского интерфейса Bootstrap.
Не только ORM (NoORM)
https://ift.tt/P4VYgob
Хочу поделиться библиотекой, существенно упрощающей взаимодествие с базами данных.«Написать свой собственный ORM» – неплохая задачка для тех, кто решил поглубже изучить некоторые языковые особенности Питона, но в данном случае задача была другая – написать не ORM, а не-ORM. Механизм, упорядочивающий и облегчающий доступ к базам данных, но который сам по себе ни в коей мере не является ORM-ом.
Слушаем события в Selenium с помощью Listeners. Как реагировать на события без тонны кода
https://ift.tt/Z56T3KQ
Работа с веб-приложениями с использованием Selenium зачастую требует выполнения различных действий и обработки многочисленных событий. В стандартном подходе это может привести к написанию большого количества кода для логирования, обработки ошибок и выполнения других задач. В этой статье мы рассмотрим, как можно значительно упростить этот процесс, используя Listeners в Selenium.
Не статья, а позорище какое-то! Sentiment-анализ комментариев из блога
https://ift.tt/QP2YTuO
У нас есть своя ML-платформа, серверное железо и опыт в развертывании IT-инфраструктуры. Вполне логично, что в какой-то момент возник вопрос: что, если проанализировать эмоциональный окрас комментариев в блоге с помощью LLM?
Daniel Quinn / django-cool-urls
https://ift.tt/uyE0o1F
Freeze outgoing links in time so that your site never 404s on external pages.
Celery: разбираемся с Celery Beat
https://ift.tt/qSW1PR2
Сегодня мы более глубоко разберем работу с Celery. Узнаем как работает Celery Beat внутри, научимся настраивать и создавать периодические задачи. И конечно же коснемся практических вопросов.
Машинное обучение с Python и TensorFlow на Windows. Быстрый старт
https://ift.tt/JDtEOmj
Я хочу представить вашему вниманию максимально простую инструкцию для быстрого погружения в мир машинного обучения. Инструкция ориентирована в первую очередь на начинающих программистов, мы будем применять Python 3 с библиотекой TensorFlow
Как автоматизировали тестирование SAP ERP с помощью Python
https://ift.tt/KUoJ6zx
Мы не понаслышке знаем, что автоматизация данной платформы — дело далеко не тривиальное. В этой статье я хочу поделиться с вами, как и зачем мы автоматизировали тестирование с помощью Python.
Магия динамического маппинга. Реализация универсальной обработки файлов нефиксированной структуры на Python
https://ift.tt/h65SgM7
В статье поговорим о конкретной реализации для одной из задач в рамках этой платформы на Python и Django. При этом сама концепция может быть реализована абсолютно на любом фреймворке или платформе: Spring, .NET, Laravel.
tornado - 6.4.1
https://ift.tt/JByi8dK
Масштабируемый, не блокирующий web-сервер. Скачать можно по ссылке: https://pypi.python.org/pypi/tornado/
redis - 5.0.5
https://ift.tt/BthmPbp
Python клиент для Redis. Скачать можно по ссылке: https://pypi.python.org/pypi/redis/
Сравниваем DBSCAN и OPTICS
https://ift.tt/19bsiMc
Поговорим сегодня о 2 популярных алгоритмах кластеризации — DBSCAN и OPTICS, посмотрим их особенности и сравним
Я научу вас неправильно играть в Hearts of iron. Оптимизация довоенной экономики: часть 2
https://ift.tt/aSo6EmQ
За долю секунды мы можем провести симуляцию нескольких внутриигровых лет, что позволяет нам применить простейший метод исследования - метод перебора. И, раз уж мы всё равно будем перебирать, стоит также построить графики.
django-haystack - 3.3.0
https://ift.tt/ovE7u46
Модульный поиск для Django. Скачать можно по ссылке: https://pypi.python.org/pypi/django-haystack/
Enbeddrus — обучение независящей от языка эмбеддинг-модели
https://ift.tt/Bm7SURG
Сегодня я хочу рассказать вам историю о том, как я обучил простую и компактную независящую от языка (language agnostic) модель-эмбеддер, которая умеет работать с техническими текстами о PHP и способна извлекать схожие эмбеддинги для параллельных текстов на английском и русском языках.
Мега-Учебник Flask Глава 12: Дата и время (издание 2024)
https://ift.tt/3ZLshVR
Это двенадцатая часть серии мега-учебника Flask, в которой я собираюсь рассказать вам, как работать с датами и временем таким образом, чтобы это работало для всех ваших пользователей, независимо от того, где они проживают.
Все числа равны, но некоторые равнее. Как в Python сравниваются Int и Float
https://ift.tt/l6npL8h
Ещё одна причуда Python, исследование её подноготной и попытка понять, почему так случается. Недавно в сети X был популярен этот твит (см. скриншот), и я обратил внимание. Это очередной сюрприз в Python, связанный с характерными для него уникальными деталями реализации.