TechBlog
首页
分类
标签
搜索
关于
← 返回分类列表
加载中...
100天从新手到大师
共
2
篇文章
Python-100天从新手到大师第五十六天网络数据采集概述
网络爬虫是一种自动采集网页数据的程序,广泛应用于搜索引擎、数据分析等领域。文章首先介绍了爬虫的基本概念和工作原理,即通过网页超链接持续获取数据。随后探讨了爬虫的合法性问题,强调应遵守Robots协议、控制采集频率并尊重数据产权。文中还分析了HTTP协议结构及常见状态码,并推荐了Chrome开发者工具、Postman等爬虫开发辅助工具。最后指出爬虫技术虽处法律灰色地带,但合理使用可为商业决策提供重要数据支持。
时间:10/14/2025
Python-100天从新手到大师第二十六天Python操作Word和PowerPoint文件
本文介绍了如何使用Python操作Word和PowerPoint文件。通过python-docx库可以生成包含标题、段落、列表、表格等元素的Word文档,并演示了如何读取模板文件进行批量替换生成个性化文档。对于PowerPoint文件,则可通过python-pptx库实现类似操作。这些方法能有效提高办公自动化效率,减少重复性工作。文章提供了详细的代码示例和模板文件处理思路,适合需要批量处理文档的用户参考使用。
时间:10/02/2025