【判断题】 无论质心的初始化如何,K-Means始终会给出相同的结果。
【判断题】 由于分类是回归的一种特殊情况,因此逻辑回归是线性回归的一种特殊情况。
【判断题】 当反向传播算法运行到达到最小值时,无论初始权重是什么,总是会找到...
【判断题】 使用偏差较小的模型总是比偏差较大的模型更好。
【判断题】 使决策树更深将确保更好的拟合度,但会降低鲁棒性。
【判断题】 给定用于2类分类问题的线性可分离数据集,线性SVM优于感知器,因为S...
【判断题】 最大似然估计的一个缺点是,在某些情况下(例如,多项式分布),它可...
【判断题】 支持向量机不适合大规模数据。
【判断题】 训练神经网络具有过度拟合训练数据的潜在问题。
【判断题】 如果P(A | B)= P(A),则P(A∩B)= P(A)P(B)。
【判断题】 由于决策树学会了对离散值输出而不是实值函数进行分类,因此它们不可...
【判断题】 当MAP中使用的先验是参数空间上的统一先验时,MAP估计等于ML估计。
【判断题】 当数据集标签错误的数据点时,随机森林通常比AdaBoost更好。
【判断题】 假设属性的数量固定,则可以在时间上以线性方式学习基于高斯的贝叶斯...
【判断题】 通常,当试图从大量观察中学习具有少量状态的HMM时,我们几乎总是可...
【判断题】 选择用于k均值聚类的聚类数k的一种好方法是尝试k的多个值,并选择最...
【判断题】 要将工作申请分为两类,并使用密度估计来检测离职申请人,我们可以使...
【判断题】 随机梯度下降每次更新执行的计算量少于批梯度下降。
【判断题】 数据索引是保证数据处理高性能的软件角度的一种手段,不做数据索引的...
【判断题】 数据索引就像给每条数据装了个信箱。
【判断题】 数据复制或者备份均是为了从提高数据并发这个角度来设计和实现的。
【判断题】 数据存储体系中并不牵扯计算机网络这一环节。
【判断题】 任务调度系统的设计与实现才能使得数据收集工作可以不间断地按照既定...
【判断题】 数据收集中的拉模式需要通过定时的方式不断地触发,才能源源不断地获...
【判断题】 经常跟管理层打交道并进行有效地关于商业领域的讨论有助于数据科学项...
【判断题】 公司内部收集的数据不存在需要考虑数据隐私的环节。
【判断题】 任何对数据处理与存储系统的操作均需要记录,这符合数据安全的要求。
【判断题】 管理员不需要验证就可以访问数据存储系统中的任何数据,这符合数据安...
【判断题】 数据压缩与解压缩可以使得数据处理的速度加快。
【判断题】 非结构化数据也可以使用关系型数据库来存储。
【判断题】 使用正则表达式可以找到一个文本文件中所有可能出现的手机号码。
【判断题】 小数据集的数据处理最好也由计算机手段来完成。
【判断题】 通过统计学可以推测掷两个撒子同时选中3点的几率。
【判断题】 完整性,一致性,时效性,唯一性,有效性,准确性是衡量数据质量的六...
【判断题】 根据数据科学家与数据工程师对于问题的理解并相互讨论,然后确定需要...
【判断题】 对于文本数据和多媒体数据进行特征提取是为了方便对于这类数据的观察和理解。
【判断题】 许多企业在开展数据科学项目时候都倒在了数据预处理的这个步骤。
【判断题】 数据收集与预处理过程中是不要对数据进行可视化分析和观察的。
【判断题】 零封中国围棋大师柯洁的AlphaGO是人工智能的产物。
【判断题】 不乱数据科学研究,数据收集,或是大数据分析的任务均需要反复进行直...
【判断题】 数据收集的任务是不需要和其他人员进行沟通的可以独立开展进行。
【判断题】 数据工程师必备技能是:必要概念的理解,数学基础,编程技能,以及必...
【判断题】 不论从事数据科学家,还是数据工程师,或是数据分析师均需要对相应的...
【判断题】 DB是现在所定义的数据容量最大的单位。
【判断题】 语音识别技术是机器学习的产物。
【判断题】 数据收集与数据预处理任务占据数据科学90%的工作量。
【判断题】 非结构化数据的存储相关技术发展要比结构化数据的存储的发展的早。
【判断题】 使用云存储服务就一定可以帮助企业节省成本。
【判断题】 车辆或者手机GPS跟踪产生的数据也可以作为数据科学的数据来源。
【判断题】 1ZB相当于全世界海滩的沙粒的总和。
【判断题】 数据复制可以解决因为不可抗因素造成的数据丢失的问题。
【判断题】 从互联网收集到的数据大比重的都是非结构化数据。
【判断题】 CPU在并行处理能力上比GPU更强。
【判断题】 现代计算机组件的发展已经不受摩尔定律的影响了。
【判断题】 数据收集与数据预处理工作并不需要掌握对应必备的数学知识。
【判断题】 数据质量是直接影响影响数据科学(或大数据)研究效果的因素。
【判断题】 进行数据科学(或大数据)研究首先需要确认需要解决的商业问题。
【判断题】 处理40PB容量的数据就是大数据处理。
【问答题】 依据类信息可利用的程度,离群点挖掘可分为哪三种基本方法?
【问答题】 简述离群点挖掘问题的构成。
【问答题】 为什么要关注离群点?
【问答题】 下表所示的相依表汇总了超级市场的事务数据。其中hot dogs指包含热...
【问答题】 分别说明利用支持度、置信度和提升度评价关联规则的优缺点。
【问答题】 一个数据库有5个事务,如表所示。设min_sup=60%,min_conf=...
【问答题】 考虑如下的频繁3-项集:{1,2,3},{1,2,4},{1,2...
【问答题】 数据集如下表所示: (a)把每一个事务作为一个购物篮,计算项集{e...
【问答题】 列举关联规则在不同领域中应用的实例。
【问答题】 什么是频繁项集?
【问答题】 下表中列出了4个点的两个最近邻。使用SNN相似度定义,计算每对点之...
【问答题】 什么是聚类?简单描述如下的聚类方法:划分方法,层次方法,基于密度...
【问答题】 假设描述学生的信息包含属性:性别,籍贯,年龄。有两条记录p、q及两...
【问答题】 简述k-means算法,层次聚类算法的优缺点。
【问答题】 典型聚类方法有哪些?
【问答题】 数据挖掘对聚类的典型要求有哪些?
【问答题】 简述典型的聚类分析任务包括的步骤。
【问答题】 考虑下表数据集,请完成以下问题: (1)估计条件概率。 (2)根...
【问答题】 考虑下表所示二元分类问题的数据集。 (1)计算按照属性A和B划分时...
【问答题】 评估分类模型的性能的方法有哪些?
【问答题】 简述分类模型性能评价的指标。
【问答题】 简述分类模型的评价。
【问答题】 简述决策树的构建。
【问答题】 什么是叶节点?
【问答题】 什么是决策节点?
【填空题】 决策树是一种树形结构,包括()和()三个部分。
【问答题】 分类模型的学习方法有哪些?
【问答题】 分类的定义是什么?
【问答题】 数据聚合需要考虑的问题有哪些?
【问答题】 以下是一个商场所销售商品的价格清单(按递增顺序排列,括号中的数表...
【问答题】 给定两个向量对象,分别表示为p1(22,1,42,10),p2(2...
【问答题】 已知数据元组中age的值如下(按递增序): 13,15,16,16...
【问答题】 假定用于分析的数据包含属性age,数据元组中age的值如下(按递增序)...
【问答题】 数据的预处理方法有哪些?
【填空题】 特征搜索过程中不可缺少的环节就是()。
【问答题】 简述特征子集选择的搜索策略。
【填空题】 根据特征选择过程与后续 数据挖掘任务的关联可分为三种方法:()。...
【问答题】 什么是特征选择?
【问答题】 简述抽样的定义及分类。
【问答题】 简述维度归约和特征变换。
【问答题】 数据变换的内容是什么?
【问答题】 数据聚合的目的是什么?
微信扫一扫免费使用
拍照搜题、语音搜题、文字搜题