MarkItDown 是一个轻量级的 Python 工具,用于将各种文件转换为 Markdown 格式,以便在 LLM 和相关文本分析流程中使用。在这方面,它与 textract 最为相似,但更侧重于保留文档的重要结构和内容(包括标题、列表、表格、链接等)。虽然输出结果通常相当美观且易于阅读,但它主要面向文本分析工具,对于需要高保真度文档转换以供人阅读的用户而言,可能并非最佳选择。
12306抢票小爬虫。本项目基于selenium实现了12306的自动登录抢票,可自动过滑动验证码,自动查询车票是否开售,一旦放票可以自动选票并提交订单,可以选学生票,你只需在10分钟内支付即可。
在PLOGS系统中进行工作任务计划、执行、管理,当任务完成后会自动归档,自动生成项目工作周报 (日报、周报、月报)和人员工作周报(日报、周报、月报)并且支持项目文档在线预览,项目文档全文检索(可对文件内容检索),另外本系统提供wfs的个人网盘功能.
ES全文搜索引擎,基于Elasticsearch构建网站日志处理系统,通过数据同步工具等一些列开源组件来快速构建一个日志处理系统,项目雏形初步成型中。
基于spring-boot+quartz的CRUD任务管理系统
从0到1构建分布式秒杀系统,脱离案例讲架构都是耍流氓