当前位置: 首页 > news >正文

爬虫-网页基础

HTML 基本语法

HTML:Hyper Text Markup Language, 超文本标记语言,是计算机语言的一种,由元素构成。

p元素

<p>Web 真好玩!</p>

由三大部分组成

  1. 开始标签:一对尖括号中间包裹这元素名称
  2. 元素内容:页面中用户可以看到的内容
  3. 结束标签:与开始标签类似,区别在于元素名称前有一个斜杠 /

a元素

互联网中必不可少的一个要素是超链接,对应到HTML语言中就是a元素

<a href="https://web.shanbay.com/codetime/home/" target="_blank">扇贝编程首页</a>

分析:

  1. <a href="https://web.shanbay.com/codetime/home/" target="_blank">为元素开始标签
  2. 扇贝编程首页,元素内容
  3. </a> 元素的结束标签

a元素的开始标签中有许多额外信息,这些信息就是元素的 属性

元素属性

元素的属性需要写在开始标签中,写成  属性名称="属性值"。元素的属性是额外信息,不会直接展示给用户,而是提供给浏览器、程序解析使用。

上面的例子中 href 和 target 是a元素的两条属性。

:属性值是用英文双引号,多个属性之间使用一个空格隔开

最常见的属性还有class、id、和 style。

class和id是用来标识元素的。

class:标识某一类元素,在一份HTML文档中可以重复出现。

id: 标识具体的某一个元素。其值在整个HTML中是唯一的。

style:为元素设置样式。

img元素

<img src="https://media-image1.baydn.com/storage_media_image/svpyor/b070ba779623e1405ad77dc048f0552b.68b5c7778324e642ffaee2d1034fce98.png" alt="">

img 元素用来描述图片的。有两个属性:

src:图片来源属性

alt:用于替换的文本属性

:img元素只有开始标签,没有元素内容以及结束标签。这就说到了一种元素叫空元素

空元素

有些元素不需要提供文本内容,自然不需要元素内容。那就是空元素

img元素,换行符 br(break)元素,水平分割线 hr(horizontal)元素均属于空元素。

ol元素

有序列表由外层 ol(ordered lists)元素和 li(list item)元素构成

ul元素

无序列表则是由外层 ul (unordered lists)元素和内层 li 元素构成。

HTML 文档结构

我们从网页内容第一行看起。第一行的 !<DOCTYPE html> 表明该文件是 HTML 文档,便于浏览器正确解析,没有实际含义。DOCTYPE 之后的整个网页内容都包裹在 html 元素 中,这是约定俗成的格式。如此一来,网页内所有元素都是 html 元素的子元素,整个 HTML 文档像树一样开枝散叶,结构清晰明朗。因此,html 元素也被称为 根元素。

再往内部看,网页根元素最粗壮的两个分支,一个叫 head 元素,另一个叫 body 元素。它们分别是网页的 网页头 和 网页体

HTML规定:

  • 用 title 元素 设置网页标题,这个标题将显示在浏览器标签页上
  • 用 meta 元素 设置网元信息,这些信息包括网页使用什么样的字符编码方式、样式、整体布局,还包含页面描述信息和面向搜索引擎的搜索关键字等等。

head 元素中还有许多 link 元素 和 script 元素,它们负责将 HTML 文档与对应的 CSS 样式、JavaScript 代码文件关联起来

http://www.lryc.cn/news/391131.html

相关文章:

  • 保存huggingface缓存中AI模型(从本地加载AI模型数据)
  • wps的xlsm和xltm和xlam格式的文件各有什么区别
  • 软件性能测试有哪几种测试方法?专业性能测试报告出具
  • JavaScript语言简介与实战应用:从零开始的编程之旅
  • 如何理解synchronized锁升级
  • js【最佳实践】遍历数组的八种方法(含数组遍历 API 的对比)for,forEach,for of,map,filter,reduce,every,some
  • Node.js开发实战 视频教程 下载
  • VS2022(Visual Studio 2022)最新安装教程
  • 从华为和特斯拉之争,看智能驾驶的未来
  • 20240705 每日AI必读资讯
  • C++ 设计模式之访问者模式
  • linux——IPC 进程间通信
  • JAVA数字化产科管理平台源码:涵盖了孕妇从建档、产检、保健、随访、分娩到产后42天全流程的信息化管理
  • http数据传输确保完整性和保密性整流程方案(含源码)
  • UE插件与云渲染:10个提升效率的选择
  • [Shell编程学习路线]——shell脚本中case语句多分支选择详解
  • Django REST Framework(四)DRF Serializer
  • 【C语言】bool 关键字
  • 开发电商ERP系统需要接入哪些平台API?
  • Meet AI4S 直播预告丨房价分析新思路:神经网络直击复杂地理环境中的空间异质性
  • 支持向量机(SVM)在机器学习中的简单示例
  • 使用Anaconda虚拟环境安装Opencv、pytorch、torchvision踩坑记录
  • 【人工智能】CPU、GPU与TPU:人工智能领域的核心处理器概述
  • 【康复学习--LeetCode每日一题】3099. 哈沙德数
  • docker使用jdk21启动jar包报错
  • Object 类中的公共方法详解
  • python 字典 一个key 多 value 遍历
  • vue---基本原理(二)
  • 桂花网蓝牙网关X1000:引领物联网新时代的智能连接
  • JAVA案例模拟电影信息系统