A股上市公司传智教育(股票代码 003032)旗下技术交流社区北京昌平校区

 找回密码
 加入黑马

QQ登录

只需一步,快速开始

包管理

管理包和依赖的工具。

  • pip – Python 包和依赖关系管理工具。

  • pip-tools – 保证 Python 包依赖关系更新的一组工具。

  • conda – 跨平台,Python 二进制包管理工具。

  • Curdling – 管理 Python 包的命令行工具。

  • wheel – Python 分发的新标准,意在取代 eggs。



文本处理

用于解析和操作文本的库。

  • 通用

    • chardet – 字符编码检测器,兼容 Python2 和 Python3。

    • difflib – (Python 标准库)帮助我们进行差异化比较。

    • ftfy – 让Unicode文本更完整更连贯。

    • fuzzywuzzy – 模糊字符串匹配。

    • Levenshtein – 快速计算编辑距离以及字符串的相似度。

    • pangu.py – 在中日韩语字符和数字字母之间添加空格。

    • pyfiglet -figlet 的 Python实现。

    • shortuuid – 一个生成器库,用以生成简洁的,明白的,URL 安全的 UUID。

    • unidecode – Unicode 文本的 ASCII 转换形式 。

    • uniout – 打印可读的字符,而不是转义的字符串。

    • xpinyin – 一个用于把汉字转换为拼音的库。


  • Slug化

    • awesome-slugify – 一个 Python slug 化库,可以保持 Unicode。

    • python-slugify – Python slug 化库,可以把 unicode 转化为 ASCII。

    • unicode-slugify – 一个 slug 工具,可以生成 unicode slugs ,需要依赖 Django 。


  • 解析器

    • phonenumbers – 解析,格式化,储存,验证电话号码。

    • PLY – lex 和 yacc 解析工具的 Python 实现。

    • Pygments – 通用语法高亮工具。

    • pyparsing – 生成通用解析器的框架。

    • python-nameparser – 把一个人名分解为几个独立的部分。

    • python-user-agents – 浏览器 user agent 解析器。

    • sqlparse – 一个无验证的 SQL 解析器。




自然语言处理

用来处理人类语言的库。

  • NLTK – 一个先进的平台,用以构建处理人类语言数据的 Python 程序。

  • jieba – 中文分词工具。

  • langid.py – 独立的语言识别系统。

  • Pattern – Python 网络信息挖掘模块。

  • SnowNLP – 一个用来处理中文文本的库。

  • TextBlob – 为进行普通自然语言处理任务提供一致的 API。

  • TextGrocery – 一简单高效的短文本分类工具,基于 LibLinear 和 Jieba。



图像处理

用来操作图像的库.

  • pillow – Pillow 是一个更加易用版的 PIL。

  • hmap – 图像直方图映射。

  • imgSeek – 一个使用视觉相似性搜索一组图片集合的项目。

  • nude.py – 裸体检测。

  • pyBarcode – 不借助 PIL 库在 Python 程序中生成条形码。

  • pygram – 类似 Instagram 的图像滤镜。

  • python-qrcode – 一个纯 Python 实现的二维码生成器。

  • Quads – 基于四叉树的计算机艺术。

  • scikit-image – 一个用于(科学)图像处理的 Python 库。

  • thumbor – 一个小型图像服务,具有剪裁,尺寸重设和翻转功能。

  • wand – MagickWand的Python 绑定。MagickWand 是 ImageMagick的 C API 。



HTTP

使用HTTP的库。

  • requests – 人性化的HTTP请求库。

  • grequests – requests 库 + gevent ,用于异步 HTTP 请求.

  • httplib2 – 全面的 HTTP 客户端库。

  • treq – 类似 requests 的Python API 构建于 Twisted HTTP 客户端之上。

  • urllib3 – 一个具有线程安全连接池,支持文件 post,清晰友好的 HTTP 库。



数据库

Python实现的数据库。

  • pickleDB – 一个简单,轻量级键值储存数据库。

  • PipelineDB – 流式 SQL 数据库。

  • TinyDB – 一个微型的,面向文档型数据库。

  • ZODB – 一个 Python 原生对象数据库。一个键值和对象图数据库。



Web 框架

全栈 web 框架。

  • Django – Python 界最流行的 web 框架。

    • awesome-django系列


  • Flask – 一个 Python 微型框架。

    • awesome-flask系列


  • Pyramid – 一个小巧,快速,接地气的开源Python web 框架。

    • awesome-pyramid系列


  • Bottle – 一个快速小巧,轻量级的 WSGI 微型 web 框架。

  • CherryPy – 一个极简的 Python web 框架,服从 HTTP/1.1 协议且具有WSGI 线程池。

  • TurboGears – 一个可以扩展为全栈解决方案的微型框架。

  • web.py – 一个 Python 的 web 框架,既简单,又强大。

  • web2py – 一个全栈 web 框架和平台,专注于简单易用。

  • Tornado – 一个web 框架和异步网络库。



CMS

内容管理系统

  • django-cms – 一个开源的,企业级 CMS,基于 Django。

  • djedi-cms – 一个轻量级但却非常强大的 Django CMS ,考虑到了插件,内联编辑以及性能。

  • FeinCMS – 基于 Django 构建的最先进的内容管理系统之一。

  • Kotti – 一个高级的,Python 范的 web 应用框架,基于 Pyramid 构建。

  • Mezzanine – 一个强大的,持续的,灵活的内容管理平台。

  • Opps – 一个为杂志,报纸网站以及大流量门户网站设计的 CMS 平台,基于 Django。

  • Plone – 一个构建于开源应用服务器 Zope 之上的 CMS。

  • Quokka – 灵活,可扩展的小型 CMS,基于 Flask 和 MongoDB。

  • Wagtail – 一个 Django 内容管理系统。

  • Widgy – 最新的 CMS 框架,基于 Django。



电子商务

用于电子商务以及支付的框架和库。

  • django-oscar – 一个用于 Django 的开源的电子商务框架。

  • django-shop – 一个基于 Django 的店铺系统。

  • Cartridge – 一个基于 Mezzanine 构建的购物车应用。

  • shoop – 一个基于 Django 的开源电子商务平台。

  • alipay – 非官方的 Python 支付宝 API。

  • merchant – 一个可以接收来自多种支付平台支付的 Django 应用。

  • money – 货币类库with optional CLDR-backed locale-aware formatting and an extensible currency exchange solution.

  • python-currencies – 显示货币格式以及它的数值。



电子邮件

用来发送和解析电子邮件的库。

  • django-celery-ses – 带有 AWS SES 和 Celery 的 Django email 后端。

  • envelopes – 供人类使用的电子邮件库。

  • flanker – 一个 email 地址和 Mime 解析库。

  • imbox – Python IMAP 库

  • inbox.py – Python SMTP 服务器。

  • inbox – 一个开源电子邮件工具箱。

  • lamson – Python 风格的 SMTP 应用服务器。

  • mailjet – Mailjet API 实现,用来提供批量发送邮件,统计等功能。

  • marrow.mailer – 高性能可扩展邮件分发框架。

  • modoboa – 一个邮件托管和管理平台,具有现代的、简约的 Web UI。

  • pyzmail – 创建,发送和解析电子邮件。

  • Talon – Mailgun 库,用来抽取信息和签名。



网络站点爬取

爬取网络站点的库

  • Scrapy – 一个快速高级的屏幕爬取及网页采集框架。

  • cola – 一个分布式爬虫框架。

  • Demiurge – 基于PyQuery 的爬虫微型框架。

  • feedparser – 通用 feed 解析器。

  • Grab – 站点爬取框架。

  • MechanicalSoup – 用于自动和网络站点交互的 Python 库。

  • portia – Scrapy 可视化爬取。

  • pyspider – 一个强大的爬虫系统。

  • RoboBrowser – 一个简单的,Python 风格的库,用来浏览网站,而不需要一个独立安装的浏览器。



网页内容提取

用于进行网页内容提取的库。

  • Haul – 一个可以扩展的图像爬取工具。

  • html2text – 将 HTML 转换为 Markdown 格式文本

  • lassie – 人性化的网页内容检索库。

  • micawber -一个小型网页内容提取库,用来从 URLs 提取富内容。

  • newspaper – 使用 Python 进行新闻提取,文章提取以及内容策展。

  • opengraph – 一个用来解析开放内容协议(Open Graph Protocol)的 Python模块。

  • python-goose – HTML内容/文章提取器。

  • python-readability– arc90 公司 readability 工具的 Python 高速端口

  • sanitize – 为杂乱的数据世界带来调理性。

  • sumy – 一个为文本文件和 HTML 页面进行自动摘要的模块。

  • textract – 从任何格式的文档中提取文本,Word,PowerPoint,PDFs 等等。




2 个回复

倒序浏览
回复 使用道具 举报
奈斯
回复 使用道具 举报
您需要登录后才可以回帖 登录 | 加入黑马