全文索引会用在什么方面,如何卸载oracle11g数据库

Oracle数据库中文全文索引详细信息

日期： 2010年5月11日作者：

一、历史背景

虽然Oracle9i数据库的全文搜索技术以前很完善，但Oracle Text使Oracle9i具备了强悍的爱笑鞋搜索能力和智能的爱笑鞋维护能力。 Oracle Text是Oracle9i采用的新头衔，在Oracle8/8i中称为Oracle interMedia Text，在Oracle8之前称为Oracle ConText Cartridge。

二. Oracle Text在索引文档时使用的主要逻辑步骤如下：

(1)数据保存逻辑检索表的所有行，读取列的数据。通常，这只是列数据，但也有将列数据用作文档数据的指针的数据存储。

)2)过滤器提取文档数据，并将其转换为微笑鞋的显示方式。这是存储二进制文档(如Word和Acrobat文件)时必需的。滤波器的输出不一定是纯笑鞋形式，可以是XML或HTML等笑鞋形式。

)3)分段提取滤波器的输出信息，并将其转换为纯微笑鞋。不同的搞笑鞋格式(包括XML和HTML )有不同的分段。转换为微笑的鞋会触摸主要文档段的标记，删除不可见的信息，并重新格式化微笑鞋。

)词法分析器提取段中纯爱的笑鞋，将其分割为不继续的标志。既有用空白文字区分语言的词法分析器，也有分阶段用复杂的亚洲语言运用的专业词法分析器。

)索引引擎提取词法分析器中的所有标志、文档段在段中的偏移以及称为非索引字的低信息量字列表，并建立反向索引。倒回索引以存储标志和包含该标志的文档。

三、必要权限

要使用Oracle Text，您必须具有CTXAPP角色或CTXSYS用户。 Oracle Text为系统维护人员提供CTXSYS用户，为操作顺序开发人员提供CTXAPP角色。具有CTXAPP角色的用户可以执行以下功能：创建索引、维护Oracle Text数据字典、设置和删除首选项、执行Oracle Text查询以及使用Oracle Text PL/SQL序列包

如图所示：

四.详细完成

在笑的鞋中加入笑的鞋列，可以建立Oracle Text索引。文档以多种方案、格式和语言存储。因此，每个Oracle文本索引都有许多需要配置的选项，以便在特定情况下配置索引。创建索引时，Oracle Text可以使用多个隐式值，但用户通常需要确定首选项才能配置索引。

每个索引的许多选择组成称为“类”的功能组，每个类集中表现配置的某些方面，可以认为这些类是与文档数据库相关的疑问。例如，数据存储、过滤器、词法分析器、相关词汇、存储等。

每个类都有许多预定义的行为，称为对象。每个对象都可以回答类中的问题，大多数对象都包含属性。确定属性以自定义对象，并使索引配置能够适应各种操作。

(1)存储类

存储类为构成Oracle Text索引的数据库表和索引指定表空间参数和建立参数。基本对象只有BASIC_STORAGE，其属性为I_Index_Clause、I_Table_Clause、K_Table_Clause、N_Table_Clause、_ clau clause

)2)数据存储(Datastore )类

数据存储：关于存储在列中的微笑鞋的位置和其他信息。默认情况下，笑着的鞋直接保存在列中，表中的每一行代表自己的完成文件。其他数据存储位置包括存储在由自己的文件或URL标识的网页中的位置。七个基本对象包括Default_Datastore、Detail_Datastore、Direct_Datastore、File_Datastore、Multi_Column_Datastore

)3)文档段组(Section Group )类

文档段组是用于指定文档段组的对象。必须定义文档段，然后使用索引决策WITHIN运算符在文档段中执行查询。文档中安静的溪流是文档段组的一部分。七个AUTO_SECTION_GROUP、BASIC_SECTION_GROUP、HTML_SECTION_GROUP、NEWS_SECTION_GROUP和null_sroup

)4)关于同义词词典(Wordlist )类

词典标记用于索引的词干和模糊结婚照选项的相关语言可以是一个基本对象BASIC_WORDLIST，其属性为Fuzzy_Match、Fuzzy_Numresults、fuzzy _ surd list

(5)索引集(Index Set)

索引集是一个或多个Oracle 索引 (不是Oracle Text索引) 的集合，用于树立 CTXCAT类型的Oracle Text索引，只需一个基本对象BASIC_INDEX_SET。

(6)词法分析器(Lexer)类

词法分析器类标识爱笑的鞋子运用的言语，还确定在爱笑的鞋子中如何标识标志。默许的词法分析器是英语或其他西欧言语，用空格、规范标点和非字母数字字符标识标志，同时禁用大小写。包括8个基本对象：BASIC_LEXER、CHINESE_LEXER、CHINESE_VGRAM_LEXER、JAPANESE_LEXER、JAPANESE_VGRAM_LEXER、KOREAN_LEXER、KOREAN__MORPH_ LEXER、MULTI_LEXER。

(7)过滤器(Filter)类

过滤器确定如何过滤爱笑的鞋子以树立索引。能够运用过滤器对文字处理器处理的文档、格式化的文档、纯爱笑的鞋子和 HTML 文档树立索引，包括5个基本对象：CHARSET_FILTER、INSO_FILTER INSO、NULL_FILTER、PROCEDURE_FILTER、USER_FILTER。

(8)非索引字表(Stoplist)类

非索引字表类是用以指定一组不编入索引的单词 (称为非索引字)。有两个基本对象：BASIC_STOPLIST (一种言语中的一切非索引字) 、 MULTI_STOPLIST (包括多种言语中的非索引字的多言语非索引字表)。

详细操作理论

1、树立词法分析器及有关词表

Begin

-- 定义一个词法分析器

ctx_ddl.drop_preference('cnlex');

ctx_ddl.create_preference('cnlex','CHINESE_LEXER'); --针对中文

-- 定义一个有关词表

ctx_ddl.create_preference('mywordlist', 'BASIC_WORDLIST');

ctx_ddl.set_attribute('mywordlist','PREFIX_INDEX','TRUE');

ctx_ddl.set_attribute('mywordlist','PREFIX_MIN_LENGTH',1);

ctx_ddl.set_attribute('mywordlist','PREFIX_MAX_LENGTH', 5);

ctx_ddl.set_attribute('mywordlist','SUBSTRING_INDEX', 'YES');

end;

// 上面的语句中，假设是针对英语语种则能够采用下面的语句来定义词法分析器

ctx_ddl.create_preference('mylex','BASIC_LEXER');

ctx_ddl.set_attribute('mylex','printjoins','_-');