首页 > 编程知识 正文

过滤器的功能,weka是什么软件

时间:2023-05-04 20:35:39 阅读:60362 作者:4631

作业三、所有过滤器介绍以下罗列weka所有过滤器的介绍

AllFilter实例过滤器。 在不更改的情况下通过所有实例。 主要用于测试目标。MultiFilter:连续应用多个过滤器。 如果提供的所有过滤器都是StreamableFilters,则它们也用作可流动的过滤器。RenameRalation:允许重命名一组实例关系的过滤器。 3358 www.Sina.com/http://www.Sina.com/addclassification :用于将分类、类分布和错误标志添加到包含分类器的数据集的过滤器。 分类器根据数据本身训练或作为序列化模型提供。 属性选择:可用于选择属性的监视属性过滤器。 它很灵活,可以将多种搜索方法和评估方法结合起来。 ClassConditionalProbabilities :将公称值和/或数值属性的值转换为类条件的概率。 如果有k个类,则为每个原始类创建k个新属性,并给出pr (自动值|类)。 ClassOrder更改类的顺序,使类的值不再与头文件中指定的顺序匹配。 这些值按用户指定的顺序排序。 ——可以按班级频率的升序/降序排序,也可以随机排序。 Discretize :将数据集中的数字属性范围离散为公称属性的实例过滤器。 离散化采用Fayyad Irani的MDL方法(缺省)。 mergenominalvalues :使用chaid方法合并指定属性(class属性除外)中所有名义属性的值。 但是,不考虑重新划分合并子集。 NominalToBinary :将所有公称属性转换为二进制数字属性。 分区成员:使用分区生成器生成分区成员值的筛选器; 过滤的实例由这些值和class属性(如果设置为输入数据)组成,并显示为稀疏实例。 33558 www.Sina.com/class balancer :重置数据中实例的权重,使每个类具有相同的总权重。 Resample :使用重新采样(具有或不具有替换的采样)生成数据集的随机子采样。 SpreadSubsample :为数据集生成随机子样本。 原始数据集必须完全适合内存。 此过滤器允许您指定最罕见类和最常见类之间的最大“扩展”。 StratifiedRemoveFolds :此过滤器接受数据集并输出指定的折叠以进行交叉检查。 如果不想将皱纹分层,请使用无监控版本。 3358 www.Sina.com/http://www.Sina.com/add :用于将新属性添加到数据集的实例过滤器AddCluster :根据指定的群集算法分配给每个实例AddExpression :将公式应用于现有属性以创建新属性的实例过滤器。 添加标识:将标识属性添加到数据集添加通知:更改指定属性值百分比的实例筛选器。 AddUserFields :用于添加具有用户指定类型和常数值的新属性的过滤器。 Addvalues :如果没有标签,则将指定列表中的标签添加到属性中。 CartesianProduct :用于执行笛卡尔乘积的过滤器,笛卡尔乘积是标称属性的集合。 Center :收集特定数据集中的所有数字属性,并将平均值设为零。 相当于集中数据点ChangeDateFormat :更改用于日期属性的日期格式。 ClassAssigner :允许您设置和取消设置类索引的过滤器。 群集成员:使用基于密度的群集生成群集成员值的筛选器; 过滤的实例由这些值和class属性(如果设置为输入数据)组成。 复制:复制数据集中一组属性的实例筛选器DateToNumeric :将日期属性转换为数字属性的筛选器。 Discretize (将数据集中的数字属性范围离散为公称属性的实例过滤器FirstOrder )此实例过滤器接受n个数字属性范围,并将它们替换为N-1个数字属性。 这些数字属性的值是与原始实例的连续属性值之差。 fixeddictionarystringtowordvector :将字符串属性转换为一组属性。 此属性表示字符串中文本中单词的出现信息。 因标签赋予器而异。 InterquartileRange :根据四分位数范围检测异常值和极值的滤波器。

KernelFilter :将给定的数据集转换为内核矩阵。 MakeIndicator :用舒适的大叔属性替换公称属性来创建新数据集的过滤器。 MathExpression :根据给定的公式修改数字属性。 MergeInfrequentNominalValues :合并不经常指定的公称属性的所有值。 MergeManyValues将两个公称属性的多个值合并为一个值。 MergeTwoValues :将名义属性的两个值合并为一个值。 NominalToBinary :将所有公称属性转换为二进制数字属性。 NominalToString :将名义属性(值集)转换为字符串(未指定的数值)。 Normalize :将特定数据集中的所有数字规范化。 如果设置了class属性,则不包括这样的属性。 NumericCleaner :从太小、太大或非常接近某个值的值中“清除”数值数据并将这些值设置为预定义默认值的筛选器。 编号

ToBinary:将所有数值属性转换为二进制属性(除了class属性,如果设置):如果数值属性的值正好为零,则新属性的值将为零。NumericToDate:用于将数值属性转换为日期属性的过滤器。NumericToNominal:将数值属性转换为标称属性的过滤器。NumericTransform:使用给定的转换方法转换数值属性。Obfuscate:一个简单的实例过滤器,重命名关系、所有属性名和所有标称属性值。OrdinalToNumeric:将序数标称属性转换为数字属性的属性筛选器PartitionedMultiFilter:对属性子集应用筛选器并将输出组装到新数据集的筛选器。PKIDiscretize:使用等频次分类将数值属性离散化,并强制容器的数量等于数值属性值的平方根。PrincipalComponents:执行数据的主成分分析和转换。RandomProjection:通过使用带有单位长度列的随机矩阵将数据投影到低维子空间来降低数据的维数。RandomSubset:选择非类属性的随机子集,可以是绝对值,也可以是百分比。Remove:从数据集中删除一系列属性的筛选器。RemoveByName:删除基于与属性名称匹配的正则表达式的属性,但不会删除类属性。RemoveType:删除给定类型的属性。RemoveUseless:此筛选器将删除完全不变或变化很大的属性。RenameAttribute:此过滤器用于重命名属性。RenameNominalValues:重命名命名属性的值。Reorder:一个过滤器,它生成具有新属性顺序的输出。ReplaceMissingValues:使用训练数据中的模式和方法替换数据集中名义属性和数字属性的所有缺失值。ReplaceMissingWithUserConstant:用用户提供的常量值替换数据集中所有标称、字符串、数字和日期属性的缺失值。ReplaceWithMissingValue:可用于在数据集中引入缺失值的筛选器。SortLabels:用于对标称属性的标签进行排序的简单过滤器。Standardize:标准化给定数据集中的所有数字属性,使其均值和单位方差为零(如果设置了类属性,则不包括此类属性)。StringToNominal:将字符串属性范围(未指定数量的值)转换为标称(设置数量的值)。StringToWordVector:将字符串属性转换为一组数字属性,表示来自字符串中包含的文本的单词出现信息。SwapValues:交换名义属性的两个值。TimeSeriesDelta:一个实例筛选器,它假定实例形成时间序列数据,并用当前值和某个以前(或将来)实例的等价属性属性值之间的差值替换当前实例中的属性值。TimeSeriesTranslate:一个实例筛选器,它假定实例形成时间序列数据,并用某个以前(或将来)实例的等价属性值替换当前实例中的属性值。Transpose:转换数据实例变成属性,属性变成实例。就是数据类型的转换 实例Filter NonSparseToSparse:将所有传入实例转换为稀疏格式的实例筛选器。Randomize:随机打乱通过它的实例的顺序。RemoveDuplicates:从接收到的第一批数据中删除所有重复的实例。简单地返回其他批次的副本。用来删除重复样本RemoveFolds:这个过滤器接受一个数据集并输出指定的折叠以进行交叉验证。RemoveFrequentValues:确定保留(标称)属性的哪些值(频繁值或不频繁值),并相应地过滤实例。RemoveMisclassified:用来删除分类错误的实例,删除异常值RemovePercentage:删除给定百分比的数据集的筛选器。RemoveRange:用于删除给定范围的数据集实例的筛选器。RemoveWithValues:根据属性的值过滤实例。Resample:使用带替换或不带替换的抽样生成数据集的随机子样本ReservoirSample:使用维特的储层采样算法“R”生成数据集的随机子样本。SparseToNonSparse:将所有传入的稀疏实例转换为非稀疏格式的实例筛选器。SubsetByExpression:根据用户指定的表达式过滤实例。

版权声明:该文观点仅代表作者本人。处理文章:请发送邮件至 三1五14八八95#扣扣.com 举报,一经查实,本站将立刻删除。