当前位置: 首页 > news >正文

【python爬虫】批量识别pdf中的英文,自动翻译成中文下

不管是上学还是上班,有时不可避免需要看英文文章,特别是在写毕业论文的时候。比较头疼的是把专业性很强的英文pdf文章翻译成中文。我记得我上学的时候,是一段一段复制,或者碰到不认识的单词就百度翻译一下,非常耗费时间。之前的文章提供了批量识别pdf中英文的方法,详见【python爬虫】批量识别pdf中的英文,自动翻译成中文上,本文实现自动pdf英文转中文文档。

文章目录

    • 一、导入库
    • 二、模拟登录百度翻译
    • 三、翻译英文
    • 四、把翻译语句定义成函数
    • 五、把翻译后的内容输出到txt文档中

  

一、导入库

  
首先导入需要用到的库,如果有部分库还没安装,可以采用pip install的方法进行安装。具体导入库的代码如下:

import os 
import json
import time
import random
import pandas as pd
from captcha import * 
from datetime import da
http://www.lryc.cn/news/162780.html

相关文章:

  • YApi 新版如何查看 http 请求数据
  • 自动驾驶(apollo)
  • web3.0涉及的技术
  • 26. 不相同的字符串(第一期模拟笔试)
  • Rethink LSTMGRU
  • 状态管理艺术——借助Spring StateMachine驭服复杂应用逻辑
  • 获取和设置小程序和h5的页面栈
  • Mysql基于成本选择索引
  • Element-ui container常见布局
  • ssm实现折线统计图
  • GLSL ES着色器 精度限定字
  • webrtc的FULL ICE和Lite ICE
  • flink的几种常见的执行模式
  • 蓝桥杯备赛Day8——队列
  • 用滑动条做调色板---cv2.getTrackbarPos(),cv2.creatTrackbar()
  • dubbo 服务注册使用了内网IP,而服务调用需要使用公网IP进行调用
  • 外传-Midjourney的局部重绘功能
  • Spring Boot 中使用 Poi-tl 渲染数据并生成 Word 文档
  • Java基础(二十一)十点半游戏
  • 第8节-PhotoShop基础课程-常用快捷键汇总
  • Redis带你深入学习数据类型set
  • Json“牵手”易贝商品详情数据方法,易贝商品详情API接口,易贝API申请指南
  • 《AI一键生成抖音商品种草文案》让你秒变带货王!
  • 博客系统(升级(Spring))(二)获取当前用户信息、对密码进行加密、设置统一数据格式、设置未登录拦截、线程池
  • Postman接口测试工具
  • appium+jenkins实例构建
  • c#中字段和属性的区别,委托和事件的区别
  • 香橙派使用外设驱动库wiringOP来驱动蜂鸣器
  • 微信小程序Day3笔记
  • 大数据技术之Hadoop:提交MapReduce任务到YARN执行(八)