- 1、本文档共5页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
POI读取word转换html
POI读取word转换html
文章分类:Java编程
apache POI读取word文档的文档比较少,所以只有自己慢慢的摸索,这篇文章也属于比较基础入门的,主要是针对读取word中的图片,以及文字的各种样式,如有不好的地方,请各位多多指教!?
Java代码??
/**?
?*??
?*/??
package?com.util;??
??
import?java.io.BufferedWriter;??
import?java.io.File;??
import?java.io.FileInputStream;??
import?java.io.FileNotFoundException;??
import?java.io.FileOutputStream;??
import?java.io.IOException;??
import?java.io.OutputStream;??
import?java.io.OutputStreamWriter;??
??
import?org.apache.poi.hwpf.HWPFDocument;??
import?org.apache.poi.hwpf.model.PicturesTable;??
import?org.apache.poi.hwpf.usermodel.CharacterRun;??
import?org.apache.poi.hwpf.usermodel.Picture;??
import?org.apache.poi.hwpf.usermodel.Range;??
??
/**?
?*??
?*?@author?张廷?下午10:36:40?
?*??
?*/??
public?class?WordToHtml?{??
??
????/**?
?????*?回车符ASCII码?
?????*/??
????private?static?final?short?ENTER_ASCII?=?13;??
??
????/**?
?????*?空格符ASCII码?
?????*/??
????private?static?final?short?SPACE_ASCII?=?32;??
??
????/**?
?????*?水平制表符ASCII码?
?????*/??
????private?static?final?short?TABULATION_ASCII?=?9;??
??
????private?String?htmlText?=?;??
??
????/**?
?????*?读取每个文字样式?
?????*??
?????*?@param?fileName?
?????*?@throws?Exception?
?????*/??
????public?void?getWordAndStyle(String?fileName)?throws?Exception?{??
??
????????FileInputStream?in?=?new?FileInputStream(new?File(fileName));??
??
????????HWPFDocument?doc?=?new?HWPFDocument(in);??
??
????????//?取得文档中字符的总数??
????????int?length?=?doc.characterLength();??
??
????????//?创建图片容器??
????????PicturesTable?pTable?=?doc.getPicturesTable();??
??
????????htmlText?=?htmlheadtitle?+?doc.getSummaryInformation().getTitle()?+?/title/headbody;??
??
????????//?创建临时字符串,好加以判断一串字符是否存在相同格式??
??
????????String?tempString?=?;??
??
????????for?(int?i?=?0;?i??length?-?1;?i++)?{??
????????????//?整篇文章的字符通过一个个字符的来判断,range为得到文档的范围??
????????????Range?range?=?new?Range(i,?i?+?1,?doc);??
??
????????????CharacterRun?cr?=?range.getCharacterRun(0);??
??
????????????if?(pTable.hasPicture(cr))?{??
??
????????????????//?读写图片??
????????????
文档评论(0)