首页 > 编程知识 正文

java中是否有区分词性的类库(可以定义在类中的有哪些)

时间:2023-11-30 11:44:51 阅读:310654 作者:KMEO

本文目录一览:

  • 1、用java语言实现词性标注后的名词抽取
  • 2、Java编程 如何提取单词表中的词性
  • 3、java中是否有区分词性的类库
  • 4、Java类库和包有什么区别?
  • 5、java 中常用五大包有哪些?
  • 6、java用什么分词器去 标注英文单词的词性

用java语言实现词性标注后的名词抽取

举个例子

import java.util.regex.Matcher;

import java.util.regex.Pattern;

/**

* 提取汉字

*

* @author ajax_2003

* @version 1.0, 2009-7-23

*

*/

public class ExtractKanji {

public static void main(String[] args) {

String str = "第七/m 章/q 茶树/n 芽/n 叶/n 咀/n 食性/n 害虫/n 咀/n 食/n 茶树/n 芽/n 叶/n 的/u 害虫/n ,"

+ "/w 主要/d 是/v 蛾/n 类/q 幼虫/n ,/w 包括/v 尺蠖/n 、/w 毒蛾/n 、/w 卷/q 类/n 、/w 蓑/n 蛾/n 、"

+ "/w 刺/v 蛾/n 、/w 夜蛾/n 等/u 类/n 及/c 茶/n 蚕/n 、/w 茶叶/n 斑/n 蛾/n 等/u 。"

+ "/w 另/r 一/m 类/q 是/v 象甲/n 、/w 叶/n 甲等/b 甲虫/n ,"

+ "/w 直接/a 蚕食/v 芽/n 梢/n 及/c 成/v 老叶/n 第一/m 节/q 尺蠖蛾/n 类/q 害虫/n 危害/v 茶树/n 的/u "

+ "尺蠖/n 多达/v 40/m 余/m 种/q ,/w 同/p 属/v 鳞翅目/n 尺蠖蛾/n 科/n 。";

String result = getKanji(str);

System.out.println(result);

}

private static String getKanji(String str) {

Pattern pattern = Pattern.compile("[^/\w]+");

Matcher matcher = pattern.matcher(str);

StringBuilder sb = new StringBuilder();

while (matcher.find()) {

sb.append(matcher.group());

}

return sb.toString();

}

}

Java编程 如何提取单词表中的词性

设计一个数据结构,读取文本数据,保存好。

通过不同输入参数判断不同属性。

java中是否有区分词性的类库

这个取决于你要做什么

一个词,可以有很多种词性,具体词性是根据在句子中的位置决定的。

你到底是要字典,可以查词性,还是需要语法解析器,来分析在句子中的词性

Java类库和包有什么区别?

通俗一点点讲,类是为了解决java中的问题而出现的,你要跟好友通信,就写一个通信类来解决这个问题,你要处理网页前台的数据,你就写个数据处理类,写好的类就好比数学公式,参数不同,公式固定不变,得出结果不同,你写好一个通信类,这个类不改变,但你可以跟不同人聊天

包的存在是为了区别相同名字的类出现的,包通俗的讲就是电脑上的文件夹,你可以在一个文件夹下创建两个名字一样的文本文件么,当然不可以,包也是,包里不允许同名文件,你的手机可以选择移动的手机卡和电信的手机卡,卡长的都一样,但它们能在同一个运营商那里买到么,不能,移动运营商和电信运营商相当于包,电话卡相当于同名文件,不同包存储不同功能的类

java 中常用五大包有哪些?

常用的五个

java.lang.*

提供利用 Java 编程语言进行程序设计的基础类。最重要的类是 Object(它是类层次结构的根)和 Class(它的实例表示正在运行的应用程序中的类)。

java.util.*

包含集合框架、遗留的 collection 类、事件模型、日期和时间设施、国际化和各种实用工具类(字符串标记生成器、随机数生成器和位数组、日期Date类、堆栈Stack类、向量Vector类等)。集合类、时间处理模式、日期时间工具等各类常用工具包

java.io.*

Java的核心库java.io提供了全面的IO接口。包括:文件读写、标准设备输出等。Java中IO是以流为基础进行输入输出的,所有数据被串行化写入输出流,或者从输入流读入。

java.net.*

并非所有系统都支持 IPv6 协议,而当 Java 网络连接堆栈尝试检测它并在可用时透明地使用它时,还可以利用系统属性禁用它。在 IPv6 不可用或被显式禁用的情况下,Inet6Address 对大多数网络连接操作都不再是有效参数。虽然可以保证在查找主机名时 java.net.InetAddress.getByName 之类的方法不返回 Inet6Address,但仍然可能通过传递字面值来创建此类对象。在此情况下,大多数方法在使用 Inet6Address 调用时都将抛出异常。

java.sql.*

提供使用 JavaTM 编程语言访问并处理存储在数据源(通常是一个关系数据库)中的数据的 API。此 API 包括一个框架,凭借此框架可以动态地安装不同驱动程序来访问不同数据源。

java用什么分词器去 标注英文单词的词性

可以试试stanford Tagger, 百度搜索下stanford Tagger。

中文词性标注可以用hanlp.

版权声明:该文观点仅代表作者本人。处理文章:请发送邮件至 三1五14八八95#扣扣.com 举报,一经查实,本站将立刻删除。