网站首页 > 技术教程 正文
PDF文件衍生自PostScript,最初用记事本就可以打开编辑。随着PDF嵌入的内容功能越来越多,有些二进制的图像和音视频数据,就出现了stream,以及对PDF压缩的需求。
在2008年1月,PDF成为了ISO标准(ISO 32000),截止目前停留在1.7版本。
如果你用notepad++,以文本的方式尝试打开PDF文件,基本可以看清文件的结构。但它总希望被认为是一个二进制文件,最好以binary的方式读取。为了达到这个目的,会在标题行后紧跟一个注释行,要求至少包含四个二进制字符(byte最高位为1),这样就差不多能让很多App识别出这是一个二进制文件。
以下片段,用记事本另存为PDF,就是正常的PDF文件
%PDF-1.1
%¥±?
1 0 obj
<< /Type /Catalog
/Pages 2 0 R
>>
endobj
2 0 obj
<< /Type /Pages
/Kids [3 0 R]
/Count 1
/MediaBox [0 0 200 144]
>>
endobj
3 0 obj
<< /Type /Page
/Parent 2 0 R
/Resources << /Font << /F1 << /Type /Font /Subtype /Type1/BaseFont /Times-Roman
>>
>>
>>
/Contents 4 0 R
>>
endobj
4 0 obj
<< /Length 55 >>
stream
BT
/F1 18 Tf
0 0 Td
(Hello World) Tj
ET
endstream
endobj
xref
0 5
0000000000 65535 f
0000000018 00000 n
0000000077 00000 n
0000000178 00000 n
0000000457 00000 n
trailer
<< /Root 1 0 R
/Size 5
>>
startxref
565
%%EOF
拷贝上述内容,保存为PDF文件打开,你将看到:
总结:
1.PDF版本号,在文件开头处:%PDF-1.7
2.PDF第二行乱码没啥用,随便4个高字节为1的byte:%a??ó
本次先分享到这,哈不太习惯头条的编辑发布,搞得有点麻烦。下次,我再分享一段python代码用于解析PDF的结构。
猜你喜欢
- 2024-10-26 0ops国际信息安全技术挑战赛-2019-Wallbreaker-Easy-WriteUp
- 2024-10-26 Apache2.4进阶:优化配置(apache 并发优化)
- 2024-10-26 PDF的这四个特点,作为职场人你必须知道
- 2024-10-26 Scapy:用Python编写自己的网络抓包工具
- 2024-10-26 Go 完整包列表(go打包配置文件)
- 2024-10-26 在Python中使用PDF:阅读和拆分(python读取pdf内容转word)
- 2024-10-26 Python3 环境搭建(python2环境搭建)
- 2024-10-26 大数据存储之ORC格式文件及Go实现
- 2024-10-26 你对hive的存储格式知多少?(hive 数据存储格式)
- 2024-10-26 51GIS学院分享MapGIS的二十一个实用方法及技巧
你 发表评论:
欢迎- 最近发表
-
- Win11学院:如何在Windows 11上使用WSL安装Ubuntu
- linux移植(Linux移植freemodbus)
- 独家解读:Win10预览版9879为何无法识别硬盘
- 基于Linux系统的本地Yum源搭建与配置(ISO方式、RPM方式)
- Docker镜像瘦身(docker 减小镜像大小)
- 在linux上安装ollama(linux安装locale)
- 渗透测试系统Kali推出Docker镜像(kali linux渗透测试技术详解pdf)
- Linux环境中部署Harbor私有镜像仓库
- linux之间传文件命令之Rsync傻瓜式教程
- 解决ollama在linux中安装或升级时,通过国内镜像缩短安装时长
- 标签列表
-
- 下划线是什么 (87)
- 精美网站 (58)
- qq登录界面 (90)
- nginx 命令 (82)
- nginx .http (73)
- nginx lua (70)
- nginx 重定向 (68)
- Nginx超时 (65)
- nginx 监控 (57)
- odbc (59)
- rar密码破解工具 (62)
- annotation (71)
- 红黑树 (57)
- 智力题 (62)
- php空间申请 (61)
- 按键精灵 注册码 (69)
- 软件测试报告 (59)
- ntcreatefile (64)
- 闪动文字 (56)
- guid (66)
- abap (63)
- mpeg 2 (65)
- column (63)
- dreamweaver教程 (57)
- excel行列转换 (56)
本文暂时没有评论,来添加一个吧(●'◡'●)