`
rouye
  • 浏览: 35527 次
  • 性别: Icon_minigender_2
  • 来自: 济南
社区版块
存档分类
最新评论

将word文档转化成字符串或者txt文档、将txt文档转化成字符串

阅读更多

=================================================================

/**

*

*判断是word文档还是txt文档

*/

 public String readFile() throws Exception {
   String fileRealName = "我们的幸福";   //文件名
  String fileString = null;
  if (null != fileRealName && !"".equals(fileRealName)) {
   try {
    File file = new File("d:\\test\\law\\" + fileRealName);   //d:\\test\\law\\是文档存放路径
    if (fileRealName.endsWith(".doc")) {
     fileString = WordReader.readDoc("d:\\test\\law\\"+ fileRealName);
    } else if (fileRealName.endsWith(".txt")) {
     fileString = readFile(file);
    }
   } catch (Exception e) {
    e.printStackTrace();
   }
  }
    return "moblieinfo";
 }

=================================================================

 

/**

*

*读取txt文档并返回字符串

*/

 private static String readFile(File file) throws FileNotFoundException,
   IOException {

  StringBuffer sb = new StringBuffer();
  FileReader fl = new FileReader(file);
  BufferedReader bf = new BufferedReader(fl);
  String context = null;
  do {
   context = bf.readLine();
   if (context == null) {
    break;
   } else if (!context.trim().equals("")) {
    sb.append(context + " ");
   }
  } while (context != null);
  bf.close();
  return sb.toString();
 }

 

======================================================================

package com.sdcncsi.common.util;

import java.io.File;
import java.io.FileInputStream;

import org.apache.poi.hwpf.extractor.WordExtractor;

public class WordReader {

 public WordReader() {

 }

 public static String readDoc(String doc) throws Exception {
  //       
  // 创建输入流读取DOC文件
  File newfile = new File(doc);
  System.out.println("--------------");
  FileInputStream in = new FileInputStream(newfile);
  WordExtractor extractor = null;
  String text = null;

  extractor = new WordExtractor(in);
  text = extractor.getText();

  in.close();

  return text;
 }

}
========================================================================

 

import java.io.*;
import org.apache.poi.hwpf.extractor.WordExtractor;

public class convertWordToTxt {
 public static String convertWordToTxt(FileInputStream fis,
   String outputPath, String outputFileName) {
  try {
   WordExtractor extractor = new WordExtractor(fis);
   String str = extractor.getText().trim(); // 获取Word文件中的字符

   String outputFile = outputPath + outputFileName + ".txt"; // 组装输出TXT文件的绝对路径

   FileOutputStream fos = new FileOutputStream(outputFile);
   fos.write(str.getBytes());
   fos.close();
  } catch (FileNotFoundException e) {
   return "文件不存在!";
  } catch (IOException e) {
   return "文件读写错误!";
  }
  return "OK";
 }
}
=======================================================================

备注:需要的jar包

分享到:
评论

相关推荐

    java实现word文档到xml文档转换浅析

    java实现word文档到xml文档转换浅析

    JAVA 对word 内容的提取返回String

    JAVA 对word 内容的提取返回String 的代码 两种方式详细的资源描述有机会获得我们的推荐,更有利于他人下载,赚取更多积分

    BatchDoc Word文档批量处理工具破解版

    Word文档批量内容替换功能:您可以方便的一次将多个文档中的某一个字符串替换为另一个字符串。 Word文档批量中文繁简转换功能:批量将简体汉字中文Word文档转为繁体或批量将繁体汉字中文Word文档转为简体。 批量...

    字符编码转换 字符串到Unicode的转换等

    字符编码转换 字符串到Unicode的转换等 字符高低位转换等。

    java将html文件生成word文件

    使用docx4j把html转化成Word文档,可以生成doc或docx,需要的jar都在里面了

    BacthDoc文档批量处理工具

    Word文档字符串批量替换:您可以方便的一次将多个文档中的某一个字符串替换为另一个字符串。 Word文档批量中文繁简转换:批量将简体汉字中文文档转为繁体或批量将繁体汉字中文文档转为简体。 Word文档批量设置密码...

    Batchdoc-Word文档批量处理工具V6.3中文绿色版.rar

    Batchdoc具体功能有:批量统计WORD文档的页数与字数、统计段落数行数、将指定的文档插入到WORD中指定位置,批量内容替换,批量将指定字符串替换为另一个字符串。支持各版本WORD文档,如DOC/DOCX,还可以对文本文档、...

    文档格式转换 pdf to html

    如何将word文档转换成html文档,附Java程序

    qt操作word

    qt操作word 功能:读取word文档信息,包括文字内容,大小,颜色,字体;样式;字符间距;目录 ,把信息转换成字符串输出到txt文件

    遍历文件内部查找字符串的搜索脚本 by LSS

    支持可以使用记事本打开的文本文件、源代码文件以及部分office文档(word、excel、ppt),其中office文件是先通过子函数脚本转换为txt文件再进行搜索。编写该工具的初衷是在自己的源代码中查找某个函数被调用的位置...

    基于Microsoft Word内核的文档批量处理工具(破解版)

    内容批量替换:可以很方便的一次将多个文档中的某一个字符串替换为另一个字符串; 文档合并:将多种类型的多个文档合并为一个文档; 文档类型批量转换:将多种文件类型的多个文档转换为指定类型的文档; 文档批量...

    XReplace超级字符串批量替换工具3.8官方最新版.rar

     问:对Excel文档,替换后的新的字符串如果是超过12位的数值,系统自动将其转换为科学记数格式,如果输入超过15位的数值,系统自动将15位以后的数值转换为“0”。要替换为长串数字(比如身份证号码)怎么办?答:在...

    oracle学习文档 笔记 全面 深刻 详细 通俗易懂 doc word格式 清晰 连接字符串

    oracle学习文档 笔记 全面 深刻 详细 通俗易懂 doc word格式 清晰 第一章 Oracle入门 一、 数据库概述 数据库(Database)是按照数据结构来组织、存储和管理数据的仓库,它产生于距今五十年前。简单来说是本身可视...

    java方式完整的word文件转html代码样例

    使用java的方式将word文档转换成html页面。包含代码实例和所需的jar包

    基于Java实现文件和base64字符串转换

    主要介绍了基于Java实现文件和base64字符串转换,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下

    BatchDoc v7.1.zip

    Word文档批量内容替换功能:您可以方便的一次将多个文档中的某一个字符串替换为另一个字符串。 Word文档批量中文繁简转换功能:批量将简体汉字中文Word文档转为繁体或批量将繁体汉字中文Word文档转为简体。 批量...

    BatchDoc V4.5 中文绿色版

    “字符串批量替换”功能,您可以方便的一次将多个文档中的某一个字符串替换为另一个字符串。 支持对以下格式的文件操作:Word文档(*.doc);Web页(*.htm;*.html);Rtf格式(*.rtf)文本文件(*.txt)WordPerfect文件...

    swagger2word:一个Swagger API 文档 转 Word 文档的工具项目

    甚至可以直接输入 json 字符串。 生成的 WORD 示例: --------------版本迭代历程,感谢各位小伙伴的支持-------------- 版本: SwaggerToWord 1.0 (2018-01-18) 一个Swagger API 文档转 Word 文档的工具项目 项目...

    全能字符串批量替换机7.0.rar

    全能字符串替换机用于对文件进行替换、查找、抽取、改名、内码转换等操作。 替换功能支持批量文件、批量串的处理,支持超长多行的查找串和替换串,支持动态的替换串; 改名支持批量改名、按指定顺序对文件进行编号;...

Global site tag (gtag.js) - Google Analytics