`
liss
  • 浏览: 826580 次
  • 性别: Icon_minigender_1
  • 来自: 广州
社区版块
存档分类
最新评论

Java读取word文档解决方案

    博客分类:
  • POI
阅读更多

      java读取word文档时,虽然网上介绍了很多插件poi、java2Word、jacob、itext等等,poi无法读取格式(新的API估计行好像还在处于研发阶段,不太稳定,做项目不太敢用);java2Word、jacob容易报错找不到注册,比较诡异,我曾经在不同的机器上试过,操作方法完全一致,有的机器不报错,有的报错,去他们论坛找高人解决也说不出原因,项目部署用它有点玄;itxt好像写很方便但是我查了好久资料没有见到过关于读的好办法。经过一番选择还是折中点采用rtf最好,毕竟rtf是开源格式,不需要借助任何插件,只需基本IO操作外加编码转换即可。rtf格式文件表面看来和doc没啥区别,都可以用word打开,各种格式都可以设定。

 

----- 实现的功能:读取rtf模板内容(格式和文本内容),替换变化部分,形成新的rtf文档。

 

----- 实现思路:模板中固定部分手动输入,变化的部分用$info$表示,只需替换$info$即可。

       1、采用字节的形式读取rtf模板内容

       2、将可变的内容字符串转为rtf编码

       3、替换原文中的可变部分,形成新的rtf文档

 

主要程序如下:

/**

 * 将制定的字符串转换为rtf编码

 */

public String bin2hex(String bin) {
        char[] digital = "0123456789ABCDEF".toCharArray();
        StringBuffer sb = new StringBuffer("");
        byte[] bs = bin.getBytes();
        int bit;
        for (int i = 0; i < bs.length;i++) {
            bit = (bs[i] & 0x0f0) >> 4;

            sb.append("\\'");
            sb.append(digital[bit]);
            bit = bs[i] & 0x0f;
            sb.append(digital[bit]);
        }
        return sb.toString();
    }

 

/**

 * 字节形式读取rtf模板内容

 */

public String readByteRtf(InputStream ins, String path){

   String sourcecontent = "";
  try{
    ins = new FileInputStream(path);
    byte[] b = new byte[1024];
          if (ins == null) {
               System.out.println("源模板文件不存在");
          }
          int bytesRead = 0;
          while (true) {
              bytesRead = ins.read(b, 0, 1024); // return final read bytes counts
              if(bytesRead == -1) {// end of InputStream
               System.out.println("读取模板文件结束");
               break;
              }
              sourcecontent += new String(b, 0, bytesRead); // convert to string using bytes
           }
  }catch(Exception e){
   e.printStackTrace();
  }

}

 

      以上为核心代码,剩余部分就是替换,从新组装java中的String.replace(oldstr,newstr);方法可以实现,在这就不贴了。源代码部分详见附件。运行源代码前提:

 

c盘创建YQ目录,将附件中"模板.rtf"复制到YQ目录之下,运行OpreatorRTF.java文件即可,就会在YQ目录下生成文件名如:21时15分19秒_cheney_记录.rtf 的文件。。。。。文件名是在程序中指定的呵呵。由于是由商业软件中拆分出的demo所以只是将自己原来的写的程序分离,合并在一个java文件中,所以有的方法在示例程序中看似多余,没有必要那么麻烦。

 

     对于替换部分需要循环的特例程序,我不好拆分,里面很容易暴露商业软件的东西,所以就不贴了,有需要的话可以加我QQ或者MSN,一起讨论呵呵。附件传了半天也没有传上去,没有办法只有这样搞了呵呵。模板文件附件无法存放,需要的直接联系呵呵。其实直接看以下的java程序部分,就会明白

 

/**

 * 以下部分是java源代码

 */

 

 

package com;

 

import java.io.File;

import java.io.FileInputStream;

import java.io.FileWriter;

import java.io.IOException;

import java.io.InputStream;

import java.io.PrintWriter;

import java.text.SimpleDateFormat;

import java.util.Date;

 

public class OperatorRTF {

 

/**

* 字符串转换为rtf编码

* @param content

* @return

*/

public String strToRtf(String content){

char[] digital = "0123456789ABCDEF".toCharArray();

        StringBuffer sb = new StringBuffer("");

        byte[] bs = content.getBytes();

        int bit;

        for (int i = 0; i < bs.length; i++) {

            bit = (bs[i] & 0x0f0) >> 4;

         sb.append("\\'");

            sb.append(digital[bit]);

            bit = bs[i] & 0x0f;

            sb.append(digital[bit]);

        }

        return sb.toString();

}

 

/**

* 替换文档的可变部分

* @param content

* @param replacecontent

* @param flag

* @return

*/

public String replaceRTF(String content,String replacecontent,int flag){

String rc = strToRtf(replacecontent);

String target = "";

/*if(flag==0){

target = content.replace("$time$",rc);

}*/

if(flag==0){

target = content.replace("$timetop$",rc);

}

if(flag==1){

target = content.replace("$info$",rc);

}

if(flag==2){

target = content.replace("$idea$",rc);

}

if(flag==3){

target = content.replace("$advice$",rc);

}

if(flag==4){

target = content.replace("$infosend$",rc);

}

return target;

}

 

/**

* 获取文件路径

* @param flag

* @return

*/

public String getSavePath() {

 

String path = "C:\\YQ";

 

File fDirecotry = new File(path);

if (!fDirecotry.exists()) {

fDirecotry.mkdirs();

}

return path;

}

 

/**

* 半角转为全角

*/

public String ToSBC(String input){

   char[] c = input.toCharArray();

   for (int i = 0; i < c.length; i++){

       if (c[i] == 32){

           c[i] = (char) 12288;

           continue;

       }

       if (c[i] < 127){

        c[i] = (char) (c[i] + 65248);

       }

   }

   return new String(c);

}

 

public void rgModel(String username, String content) {

// TODO Auto-generated method stub

/*  构建生成文件名 targetname:12时10分23秒_username_记录.rtf */

Date current=new Date();

        SimpleDateFormat sdf=new java.text.SimpleDateFormat("yyyy-MM-dd HH:mm:ss");

String targetname = sdf.format(current).substring(11,13) + "时";

targetname += sdf.format(current).substring(14,16) + "分";

targetname += sdf.format(current).substring(17,19) + "秒";

targetname += "_" + username +"_记录.rtf";

 

/* 字节形式读取模板文件内容,将结果转为字符串 */

String strpath = getSavePath();

String sourname = strpath+"\\"+"模板.rtf";

String sourcecontent = "";

InputStream ins = null;

try{

ins = new FileInputStream(sourname);

byte[] b = new byte[1024];

        if (ins == null) {

             System.out.println("源模板文件不存在");

        }

        int bytesRead = 0;

        while (true) {

            bytesRead = ins.read(b, 0, 1024); // return final read bytes counts

            if(bytesRead == -1) {// end of InputStream

            System.out.println("读取模板文件结束");

            break;

            }

            sourcecontent += new String(b, 0, bytesRead); // convert to string using bytes

         }

}catch(Exception e){

e.printStackTrace();

}

/* 修改变化部分 */

String targetcontent = "";

/**

* 拆分之后的数组元素与模板中的标识符对应关系

* array[0]:timetop    

* array[1]:info

* array[2]:idea

* array[3]:advice

* array[4]:infosend

*/

String array[] = content.split("~");

/**

* 2008年11月27日:更新模板之后时间无需自动填充

*/

/*String nowtime = sdf.format(current).substring(0,4) + "年";

nowtime += sdf.format(current).substring(5,7) + "月";

nowtime += sdf.format(current).substring(8,10) + "日";*/

for(int i=0;i<array.length;i++){

/*if(i==0){

targetcontent = documentDoc.replaceRTF(sourcecontent,nowtime,i);

}else{

targetcontent = documentDoc.replaceRTF(targetcontent,array[i-1],i);

}*/

if(i==0){

targetcontent = replaceRTF(sourcecontent, array[i], i);

}else{

targetcontent = replaceRTF(targetcontent, array[i], i);

}

 

}

/* 结果输出保存到文件 */

try {

FileWriter fw = new FileWriter(getSavePath()+"\\" + targetname,true);

            PrintWriter out = new PrintWriter(fw);

            if(targetcontent.equals("")||targetcontent==""){

             out.println(sourcecontent);

            }else{

             out.println(targetcontent);

            }

            out.close();

            fw.close();

            System.out.println(getSavePath()+"  该目录下生成文件" + targetname + " 成功");

} catch (IOException e) {

// TODO Auto-generated catch block

e.printStackTrace();

}

}

 

 

 

 

public static void main(String[] args) {

// TODO Auto-generated method stub

OperatorRTF oRTF = new OperatorRTF();

/**

* 被替换内容以"~"符号分割,处理的时候将其拆分为数组即可

*/

String content = "2008年10月12日9时-2008年10月12日6时~我们参照检验药品的方法~我们参照检验药品的方法~我们参照检验药品的方法~我们参照检验药品的方法";

oRTF.rgModel("cheney",content);

 

}

 

}

分享到:
评论

相关推荐

    exportDoc:使用Itext API解决使用Java创建Word文档的问题

    exportDoc该demo是使用Itext实现Java生成word文档,当然,还有其他方式可以,例如:jacob,但是它局限于windows平台 往往许多JAVA程序运行于其他操作系统 在此不讨论该方案;另一种是pio但是它是excel处理程序 对于...

    JAVA上百实例源码以及开源项目

     Java访问权限控制,为Java操作文件、写入文件分配合适的权限,定义写到文件的信息、定义文件,输出到c:/hello.txt、写信息到文件、关闭输出流。 Java绘制图片火焰效果 1个目标文件 摘要:Java源码,图形操作,火焰...

    关于Java使用EasyExcel导出动态数据为Excel文件SpringBoot代码项目示例

    1、下载资源后请先看readme文档,README.md中有项目的介绍和具体的使用流程说明和易碰到的问题及解决方案。 2、若各位项目需求与本资源的样式相符度低,例如业务有渲染单元格颜色的,或者要求字体加粗,或者写入到多...

    POI操作WORD 官方测试案例 DEMO.zip

    Apache POI 提供 Java 操作 Excel 解决方案(适用于 Excel97-2008)。 2 Apache POI的组件 Apache POI包含用于MS-Office的所有OLE2复合文档的类和方法。 此API的组件列表如下: POIFS:此组件是所有其他POI元素的...

    word源码java-BuildWord:帮我整理word文档的工具

    目前来看,java导出word大致有6种解决方案: 1:Jacob是Java-COM Bridge的缩写,它在Java与微软的COM组件之间构建一座桥梁。使用Jacob自带的DLL动态链接库,并通过JNI的方式实现了在Java平台上对COM程序的调用。DLL...

    JAVA上百实例源码以及开源项目源代码

     Java访问权限控制,为Java操作文件、写入文件分配合适的权限,定义写到文件的信息、定义文件,输出到c:/hello.txt、写信息到文件、关闭输出流。 Java绘制图片火焰效果 1个目标文件 摘要:Java源码,图形操作,火焰...

    (ApachePOIHSSFandXSSF快速指南帮助文档

    而且,还可以使用Java读取和创建MS Word和MSPowerPoint文件。Apache POI 提供Java操作Excel解决方案。 HSSF - 提供读写Microsoft Excel XLS格式档案的功能。 XSSF - 提供读写Microsoft Excel OOXML XLSX格式档案的...

    poi导出excel的使用

    Apache POI 是用Java编写的免费开源的跨平台的 Java API,Apache POI提供API给Java程式对...而且,还可以使用Java读取和创建MS Word和MSPowerPoint文件。Apache POI 提供Java操作Excel解决方案(适用于Excel97-2008)。

    java开源包11

    JSTUN 是另外一个用来解决穿越 NAT 进行通讯的 Java 解决方案,是 STUN 协议的 Java实现。 在浏览器上运行Java程序 Doppio DoppioVM 是一个可在浏览器上直接运行 Java 项目的系统,无需任何插件支持。目前它包含一...

    java开源包6

    JSTUN 是另外一个用来解决穿越 NAT 进行通讯的 Java 解决方案,是 STUN 协议的 Java实现。 在浏览器上运行Java程序 Doppio DoppioVM 是一个可在浏览器上直接运行 Java 项目的系统,无需任何插件支持。目前它包含一...

    java开源包9

    JSTUN 是另外一个用来解决穿越 NAT 进行通讯的 Java 解决方案,是 STUN 协议的 Java实现。 在浏览器上运行Java程序 Doppio DoppioVM 是一个可在浏览器上直接运行 Java 项目的系统,无需任何插件支持。目前它包含一...

    poi3.9 jar包下载

    Apache官网对poi的解释: ...此外,您可以使用Java读取和写入MS Word和MS PowerPoint文件。 Apache POI是您的Java Excel解决方案(适用于Excel 97-2008)。我们有一个完整的API用于移植其他OOXML和OLE2格式。

    java开源包4

    JSTUN 是另外一个用来解决穿越 NAT 进行通讯的 Java 解决方案,是 STUN 协议的 Java实现。 在浏览器上运行Java程序 Doppio DoppioVM 是一个可在浏览器上直接运行 Java 项目的系统,无需任何插件支持。目前它包含一...

    java开源包101

    JSTUN 是另外一个用来解决穿越 NAT 进行通讯的 Java 解决方案,是 STUN 协议的 Java实现。 在浏览器上运行Java程序 Doppio DoppioVM 是一个可在浏览器上直接运行 Java 项目的系统,无需任何插件支持。目前它包含一...

    java开源包5

    JSTUN 是另外一个用来解决穿越 NAT 进行通讯的 Java 解决方案,是 STUN 协议的 Java实现。 在浏览器上运行Java程序 Doppio DoppioVM 是一个可在浏览器上直接运行 Java 项目的系统,无需任何插件支持。目前它包含一...

    java开源包8

    JSTUN 是另外一个用来解决穿越 NAT 进行通讯的 Java 解决方案,是 STUN 协议的 Java实现。 在浏览器上运行Java程序 Doppio DoppioVM 是一个可在浏览器上直接运行 Java 项目的系统,无需任何插件支持。目前它包含一...

    java开源包10

    JSTUN 是另外一个用来解决穿越 NAT 进行通讯的 Java 解决方案,是 STUN 协议的 Java实现。 在浏览器上运行Java程序 Doppio DoppioVM 是一个可在浏览器上直接运行 Java 项目的系统,无需任何插件支持。目前它包含一...

    java开源包3

    JSTUN 是另外一个用来解决穿越 NAT 进行通讯的 Java 解决方案,是 STUN 协议的 Java实现。 在浏览器上运行Java程序 Doppio DoppioVM 是一个可在浏览器上直接运行 Java 项目的系统,无需任何插件支持。目前它包含一...

    java开源包1

    JSTUN 是另外一个用来解决穿越 NAT 进行通讯的 Java 解决方案,是 STUN 协议的 Java实现。 在浏览器上运行Java程序 Doppio DoppioVM 是一个可在浏览器上直接运行 Java 项目的系统,无需任何插件支持。目前它包含一...

    POI导入测试用数据users.xls

    此外,您还可以使用Java读取和写入MS Word和MS PowerPoint文件。Apache POI是您的Java Excel解决方案(适用于Excel 97-2008)。我们有一个完整的API用于移植其他OOXML和OLE2格式,并欢迎其他人参与。

Global site tag (gtag.js) - Google Analytics