用iTextSharp读取PDF文档中文本内容

好键 发布于 2011/10/26 20:55
阅读 4K+
收藏 0

用iTextSharp读取PDF文档中文本内容,执行这条Reader reader = new PdfReader(@"C:\WS.pdf");语句时,提示PDF header signature not found,

using System;
using System.Collections.Generic;
using System.Text;
using System.IO;
using iTextSharp.text;
using iTextSharp.text.pdf;


namespace ConsoleApplication2
{
    class Program
    {
        static void Main(string[] args)
        {
            Console.WriteLine("读取PDF文档");
            try
            {
                // 创建一个PdfReader对象
                PdfReader reader = new PdfReader(@"C:\WS.pdf");

加载中
0
鉴客
鉴客
PDF 文档受损?还是需要密码之类的?
0
好键

pdf没有加密,用wordpad.exe打开

%PDF-1.5
%âãÏÓ
29 0 obj <</Linearized 1/L 306899/O 31/E 2477/N 2/T 306272/H [ 476 202]>>
endobj

.......

 

 


 

0
e
evanpan
请问第一步是不是还要先处理PDF extraction啊?
返回顶部
顶部