欢迎光临
我们一直在努力

东财23秋《数据分析与决策》单元作业二【标准答案】

可做奥鹏国开全部院校作业论文!答案请添加qq:599792888 或 微信:1095258436

东财《数据分析与决策》单元作业二

共20道题 总分:100分

一、单选题(共4题,20分)

1.采样的时间间隔越短,数据的丢失就( )。

A、越多

B、越少

C、越不确定

D、没有影响

2.下列对于时间序列理解错误的是( )。

A、大多数时间序列都是平稳的

B、时间序列是通过定期测量时间段中某个变量获得的一组观察值

C、公司每年的红利属于离散时间序列

D、季节周期与序列的时间间隔相联系

3.当提升度( )时,称为正相关规则。

A、等于0

B、等于1

C、大于1

D、小于1

4.下列关于CARMA算法步骤的算法中错误的是( )。

A、在估计阶段的表格中记录项目集之间的关系

B、在验证阶段,需要计算候选项目集的规模

C、验证的第一步是将非频繁项目集从表格中删除

D、验证阶段的删除方式和表格裁剪方式相同

二、多选题(共8题,40分)

1.衡量关联规则强弱的指标主要有( )。

A、支持度

B、置信度

C、相似度

D、提升度

2.通过霍尔特指数平滑法可以处理( )的趋势。

A、随机

B、固定

C、非线性

D、线性

3.下列关于K均值算法理解正确的有( )。

A、K均值聚类算法是高效的,但是比较缓慢

B、K均值算法使簇内对象具有较高的相似度

C、K均值算法使簇间的相似度较低

D、K均值聚类算法的相似度的计算是根据一个簇中对象的平均值进行的

4.利用时间散点图可以分析时间序列是否存在( )。

A、趋势

B、季节性变化

C、离群值

D、缺失值

5.时间序列的特征主要有( )。

A、趋势

B、季节性周期性变化

C、连续值

D、离群值

6.CARMA算法在估计阶段,保存项目集信息的表格初始时,会按照( )步骤更新。

A、增加统计量

B、插入项目集
东财答案请进:opzy.net或请联系微信:1095258436

C、裁剪表格

D、删除表格

7.两步聚类算法的步骤为( )。

A、预聚类

B、归一化处理

C、离散值处理

D、聚类

8.下列选项中列出的聚类算法能很好处理大批量数据的有( )。

A、BIRCH聚类算法

B、分层聚类算法

C、两步聚类算法

D、K均值聚类算法

三、判断题(共8题,40分)

1.两步聚类算法主要处理较大规模的数据,可自动确定类的数目,能处理连续变量和分类变量的混合数据。( )

A、对

B、错

2.越低的最小支持度阈值产生的关联规则数量越少。

A、对

B、错

3.聚类中同一个组内的数据对象的相似性较低。( )

A、对

B、错

4.通过BIRCH聚类算法处理过的数据需要进行离群值的处理。( )

A、对

B、错

5.从数据中发现关联规则的问题可以转变为发现频繁项目集。( )

A、对

B、错

6.如果将自回归模型和移动平均模型结合,就能得到一个既包含自回归又包含移动平均的更精确的时间序列分析方法。( )

A、对

B、错

7.聚类中相似或不相似是基于数据描述属性的取值来确定的。( )

A、对

B、错

8.简单移动平均法的各元素的权重要有所差别。( )

A、对

B、错

东财《数据分析与决策》单元作业二

共20道题 总分:100分

一、单选题(共4题,20分)

1.采样的时间间隔越短,数据的丢失就( )。

A、越多

B、越少

C、越不确定

D、没有影响

2.下列对于时间序列理解错误的是( )。

A、大多数时间序列都是平稳的

B、时间序列是通过定期测量时间段中某个变量获得的一组观察值

C、公司每年的红利属于离散时间序列

D、季节周期与序列的时间间隔相联系

3.当提升度( )时,称为正相关规则。

A、等于0

B、等于1

C、大于1

D、小于1

4.下列关于CARMA算法步骤的算法中错误的是( )。

A、在估计阶段的表格中记录项目集之间的关系

B、在验证阶段,需要计算候选项目集的规模

C、验证的第一步是将非频繁项目集从表格中删除

D、验证阶段的删除方式和表格裁剪方式相同

二、多选题(共8题,40分)

1.衡量关联规则强弱的指标主要有( )。

A、支持度

B、置信度

C、相似度

D、提升度

2.通过霍尔特指数平滑法可以处理( )的趋势。

A、随机

B、固定

C、非线性

D、线性

3.下列关于K均值算法理解正确的有( )。

A、K均值聚类算法是高效的,但是比较缓慢

B、K均值算法使簇内对象具有较高的相似度

C、K均值算法使簇间的相似度较低

D、K均值聚类算法的相似度的计算是根据一个簇中对象的平均值进行的

4.利用时间散点图可以分析时间序列是否存在( )。

A、趋势

B、季节性变化

C、离群值

D、缺失值

5.时间序列的特征主要有( )。

A、趋势

B、季节性周期性变化

C、连续值

D、离群值

6.CARMA算法在估计阶段,保存项目集信息的表格初始时,会按照( )步骤更新。

A、增加统计量

B、插入项目集

C、裁剪表格

D、删除表格

7.两步聚类算法的步骤为( )。

A、预聚类

B、归一化处理

C、离散值处理

D、聚类

8.下列选项中列出的聚类算法能很好处理大批量数据的有( )。

A、BIRCH聚类算法

B、分层聚类算法

C、两步聚类算法

D、K均值聚类算法

三、判断题(共8题,40分)

1.两步聚类算法主要处理较大规模的数据,可自动确定类的数目,能处理连续变量和分类变量的混合数据。( )

A、对

B、错

2.越低的最小支持度阈值产生的关联规则数量越少。

A、对

B、错

3.聚类中同一个组内的数据对象的相似性较低。( )

A、对

B、错

4.通过BIRCH聚类算法处理过的数据需要进行离群值的处理。( )

A、对

B、错

5.从数据中发现关联规则的问题可以转变为发现频繁项目集。( )

A、对

B、错

6.如果将自回归模型和移动平均模型结合,就能得到一个既包含自回归又包含移动平均的更精确的时间序列分析方法。( )

A、对

B、错

7.聚类中相似或不相似是基于数据描述属性的取值来确定的。( )

A、对

B、错

8.简单移动平均法的各元素的权重要有所差别。( )

A、对

B、错

东财《数据分析与决策》单元作业二

共20道题 总分:100分

一、单选题(共4题,20分)

1.采样的时间间隔越短,数据的丢失就( )。

A、越多

B、越少

C、越不确定

D、没有影响

2.下列对于时间序列理解错误的是( )。

A、大多数时间序列都是平稳的

B、时间序列是通过定期测量时间段中某个变量获得的一组观察值

C、公司每年的红利属于离散时间序列

D、季节周期与序列的时间间隔相联系

3.当提升度( )时,称为正相关规则。

A、等于0

B、等于1

C、大于1

D、小于1

4.下列关于CARMA算法步骤的算法中错误的是( )。

A、在估计阶段的表格中记录项目集之间的关系

B、在验证阶段,需要计算候选项目集的规模

C、验证的第一步是将非频繁项目集从表格中删除

D、验证阶段的删除方式和表格裁剪方式相同

二、多选题(共8题,40分)

1.衡量关联规则强弱的指标主要有( )。

A、支持度

B、置信度

C、相似度

D、提升度

2.通过霍尔特指数平滑法可以处理( )的趋势。

A、随机

B、固定

C、非线性

D、线性

3.下列关于K均值算法理解正确的有( )。

A、K均值聚类算法是高效的,但是比较缓慢

B、K均值算法使簇内对象具有较高的相似度

C、K均值算法使簇间的相似度较低

D、K均值聚类算法的相似度的计算是根据一个簇中对象的平均值进行的

4.利用时间散点图可以分析时间序列是否存在( )。

A、趋势

B、季节性变化

C、离群值

D、缺失值

5.时间序列的特征主要有( )。

A、趋势

B、季节性周期性变化

C、连续值

D、离群值

6.CARMA算法在估计阶段,保存项目集信息的表格初始时,会按照( )步骤更新。

A、增加统计量

B、插入项目集

C、裁剪表格

D、删除表格

7.两步聚类算法的步骤为( )。

A、预聚类

B、归一化处理

C、离散值处理

D、聚类

8.下列选项中列出的聚类算法能很好处理大批量数据的有( )。

A、BIRCH聚类算法

B、分层聚类算法

C、两步聚类算法

D、K均值聚类算法

三、判断题(共8题,40分)

1.两步聚类算法主要处理较大规模的数据,可自动确定类的数目,能处理连续变量和分类变量的混合数据。( )

A、对

B、错

2.越低的最小支持度阈值产生的关联规则数量越少。

A、对

B、错

3.聚类中同一个组内的数据对象的相似性较低。( )

A、对

B、错

4.通过BIRCH聚类算法处理过的数据需要进行离群值的处理。( )

A、对

B、错

5.从数据中发现关联规则的问题可以转变为发现频繁项目集。( )

A、对

B、错

6.如果将自回归模型和移动平均模型结合,就能得到一个既包含自回归又包含移动平均的更精确的时间序列分析方法。( )

A、对

B、错

7.聚类中相似或不相似是基于数据描述属性的取值来确定的。( )

A、对

B、错

8.简单移动平均法的各元素的权重要有所差别。( )

A、对

B、错

东财《数据分析与决策》单元作业二

共20道题 总分:100分

一、单选题(共4题,20分)

1.采样的时间间隔越短,数据的丢失就( )。

A、越多

B、越少

C、越不确定

D、没有影响

2.下列对于时间序列理解错误的是( )。

A、大多数时间序列都是平稳的

B、时间序列是通过定期测量时间段中某个变量获得的一组观察值

C、公司每年的红利属于离散时间序列

D、季节周期与序列的时间间隔相联系

3.当提升度( )时,称为正相关规则。

A、等于0

B、等于1

C、大于1

D、小于1

4.下列关于CARMA算法步骤的算法中错误的是( )。

A、在估计阶段的表格中记录项目集之间的关系

B、在验证阶段,需要计算候选项目集的规模

C、验证的第一步是将非频繁项目集从表格中删除

D、验证阶段的删除方式和表格裁剪方式相同

二、多选题(共8题,40分)

1.衡量关联规则强弱的指标主要有( )。

A、支持度

B、置信度

C、相似度

D、提升度

2.通过霍尔特指数平滑法可以处理( )的趋势。

A、随机

B、固定

C、非线性

D、线性

3.下列关于K均值算法理解正确的有( )。

A、K均值聚类算法是高效的,但是比较缓慢

B、K均值算法使簇内对象具有较高的相似度

C、K均值算法使簇间的相似度较低

D、K均值聚类算法的相似度的计算是根据一个簇中对象的平均值进行的

4.利用时间散点图可以分析时间序列是否存在( )。

A、趋势

B、季节性变化

C、离群值

D、缺失值

5.时间序列的特征主要有( )。

A、趋势

B、季节性周期性变化

C、连续值

D、离群值

6.CARMA算法在估计阶段,保存项目集信息的表格初始时,会按照( )步骤更新。

A、增加统计量

B、插入项目集

C、裁剪表格

D、删除表格

7.两步聚类算法的步骤为( )。

A、预聚类

B、归一化处理

C、离散值处理

D、聚类

8.下列选项中列出的聚类算法能很好处理大批量数据的有( )。

A、BIRCH聚类算法

B、分层聚类算法

C、两步聚类算法

D、K均值聚类算法

三、判断题(共8题,40分)

1.两步聚类算法主要处理较大规模的数据,可自动确定类的数目,能处理连续变量和分类变量的混合数据。( )

A、对

B、错

2.越低的最小支持度阈值产生的关联规则数量越少。

A、对

B、错

3.聚类中同一个组内的数据对象的相似性较低。( )

A、对

B、错

4.通过BIRCH聚类算法处理过的数据需要进行离群值的处理。( )

A、对

B、错

5.从数据中发现关联规则的问题可以转变为发现频繁项目集。( )

A、对

B、错

6.如果将自回归模型和移动平均模型结合,就能得到一个既包含自回归又包含移动平均的更精确的时间序列分析方法。( )

A、对

B、错

7.聚类中相似或不相似是基于数据描述属性的取值来确定的。( )

A、对

B、错

8.简单移动平均法的各元素的权重要有所差别。( )

A、对

B、错

东财《数据分析与决策》单元作业二

共20道题 总分:100分

一、单选题(共4题,20分)

1.通常,用时间转换方法将季节性变化转换为( )。

A、加法季节性变化

B、减法季节性变化

C、乘法积极性变化

D、除法季节性变化

2.CARMA算法只需要对数据进行( )次扫描就可以获得比Apriori算法更低的支持度的结果。

A、一

B、两

C、三

D、四

3.Apriori算法中的发现频繁项目集步骤中,首先扫描数据,从中发现包含( )个项的项目集。

A、1

B、2

C、3

D、4

4.下列关于聚类的说法错误的是( )。

A、聚类分析适合探讨样本间相互关联关系从而对一个样本结构做一个初步的评价

B、聚类是一种监督的学习方法。

C、聚类不依赖于事先确定的数据类别

D、聚类是观察式学习

二、多选题(共8题,40分)

1.决定选择何种时间序列分析法的原则包括( )。

A、要解决的问题

B、目的

C、时间

D、时间序列数据的特点

2.利用时间散点图可以分析时间序列是否存在( )。

A、趋势

B、季节性变化

C、离群值

D、缺失值

3.时间序列的特征主要有( )。

A、趋势

B、季节性周期性变化

C、连续值

D、离群值

4.K均值聚类算法的输入包括( )。

A、聚类个数K

B、初始中心

C、n个数据对象

D、方差

5.BIRCH聚类算法在决定将某个记录划归到某个树上的节点时,会考虑该记录的( )特征。

A、变量的均值

B、变量的标准差

C、变量的方差

D、变量每个分类的个数

6.发现关联规则的步骤是( )。

A、预选指定一个最小支持度计数阈值

B、找到所有超过这个值的项目集

C、从频繁项目集中产生强关联规则

D、从频繁项目集中产生弱关联规则

7.同指数平滑法相比,自回归模型具有( )。

A、灵活性

B、通用性

C、可靠性

D、适用性

8.考察聚类内的特征主要有( )。

A、标准差

B、聚类半径

C、SSE

D、SSB

三、判断题(共8题,40分)

1.通过BIRCH聚类算法处理过的数据需要进行离群值的处理。( )

A、对

B、错

2.从数据中发现关联规则的问题可以转变为发现频繁项目集。( )

A、对

B、错

3.如果将自回归模型和移动平均模型结合,就能得到一个既包含自回归又包含移动平均的更精确的时间序列分析方法。( )

A、对

B、错

4.当提升度小于1时表明其中一个项集的出现降低了另一个项集出现的可能性。( )

A、对

B、错

5.聚类中相似或不相似是基于数据描述属性的取值来确定的。( )

A、对

B、错

6.如果当前时间点的值需要通过前两个时间点值的回归加上随机误差来计算,则称之为二阶自回归AR(2)。( )

A、对

B、错

7.对于时间序列的测量值,既可以是连续数据也可以是离散数据。( )

A、对

B、错

8.简单移动平均法的各元素的权重要有所差别。( )

A、对

B、错

东财《数据分析与决策》单元作业二

共20道题 总分:100分

一、单选题(共4题,20分)

1.采样的时间间隔越短,数据的丢失就( )。

A、越多

B、越少

C、越不确定

D、没有影响

2.下列对于时间序列理解错误的是( )。

A、大多数时间序列都是平稳的

B、时间序列是通过定期测量时间段中某个变量获得的一组观察值

C、公司每年的红利属于离散时间序列

D、季节周期与序列的时间间隔相联系

3.当提升度( )时,称为正相关规则。

A、等于0

B、等于1

C、大于1

D、小于1

4.下列关于CARMA算法步骤的算法中错误的是( )。

A、在估计阶段的表格中记录项目集之间的关系

B、在验证阶段,需要计算候选项目集的规模

C、验证的第一步是将非频繁项目集从表格中删除

D、验证阶段的删除方式和表格裁剪方式相同

二、多选题(共8题,40分)

1.衡量关联规则强弱的指标主要有( )。

A、支持度

B、置信度

C、相似度

D、提升度

2.通过霍尔特指数平滑法可以处理( )的趋势。

A、随机

B、固定

C、非线性

D、线性

3.下列关于K均值算法理解正确的有( )。

A、K均值聚类算法是高效的,但是比较缓慢

B、K均值算法使簇内对象具有较高的相似度

C、K均值算法使簇间的相似度较低

D、K均值聚类算法的相似度的计算是根据一个簇中对象的平均值进行的

4.利用时间散点图可以分析时间序列是否存在( )。

A、趋势

B、季节性变化

C、离群值

D、缺失值

5.时间序列的特征主要有( )。

A、趋势

B、季节性周期性变化

C、连续值

D、离群值

6.CARMA算法在估计阶段,保存项目集信息的表格初始时,会按照( )步骤更新。

A、增加统计量

B、插入项目集

C、裁剪表格

D、删除表格

7.两步聚类算法的步骤为( )。

A、预聚类

B、归一化处理

C、离散值处理

D、聚类

8.下列选项中列出的聚类算法能很好处理大批量数据的有( )。

A、BIRCH聚类算法

B、分层聚类算法

C、两步聚类算法

D、K均值聚类算法

三、判断题(共8题,40分)

1.两步聚类算法主要处理较大规模的数据,可自动确定类的数目,能处理连续变量和分类变量的混合数据。( )

A、对

B、错

2.越低的最小支持度阈值产生的关联规则数量越少。

A、对

B、错

3.聚类中同一个组内的数据对象的相似性较低。( )

A、对

B、错

4.通过BIRCH聚类算法处理过的数据需要进行离群值的处理。( )

A、对

B、错

5.从数据中发现关联规则的问题可以转变为发现频繁项目集。( )

A、对

B、错

6.如果将自回归模型和移动平均模型结合,就能得到一个既包含自回归又包含移动平均的更精确的时间序列分析方法。( )

A、对

B、错

7.聚类中相似或不相似是基于数据描述属性的取值来确定的。( )

A、对

B、错

8.简单移动平均法的各元素的权重要有所差别。( )

A、对

B、错

东财《数据分析与决策》单元作业二

共20道题 总分:100分

一、单选题(共4题,20分)

1.通常,用时间转换方法将季节性变化转换为( )。

A、加法季节性变化

B、减法季节性变化

C、乘法积极性变化

D、除法季节性变化

2.CARMA算法只需要对数据进行( )次扫描就可以获得比Apriori算法更低的支持度的结果。

A、一

B、两

C、三

D、四

3.Apriori算法中的发现频繁项目集步骤中,首先扫描数据,从中发现包含( )个项的项目集。

A、1

B、2

C、3

D、4

4.下列关于聚类的说法错误的是( )。

A、聚类分析适合探讨样本间相互关联关系从而对一个样本结构做一个初步的评价

B、聚类是一种监督的学习方法。

C、聚类不依赖于事先确定的数据类别

D、聚类是观察式学习

二、多选题(共8题,40分)

1.决定选择何种时间序列分析法的原则包括( )。

A、要解决的问题

B、目的

C、时间

D、时间序列数据的特点

2.利用时间散点图可以分析时间序列是否存在( )。

A、趋势

B、季节性变化

C、离群值

D、缺失值

3.时间序列的特征主要有( )。

A、趋势

B、季节性周期性变化

C、连续值

D、离群值

4.K均值聚类算法的输入包括( )。

A、聚类个数K

B、初始中心

C、n个数据对象

D、方差

5.BIRCH聚类算法在决定将某个记录划归到某个树上的节点时,会考虑该记录的( )特征。

A、变量的均值

B、变量的标准差

C、变量的方差

D、变量每个分类的个数

6.发现关联规则的步骤是( )。

A、预选指定一个最小支持度计数阈值

B、找到所有超过这个值的项目集

C、从频繁项目集中产生强关联规则

D、从频繁项目集中产生弱关联规则

7.同指数平滑法相比,自回归模型具有( )。

A、灵活性

B、通用性

C、可靠性

D、适用性

8.考察聚类内的特征主要有( )。

A、标准差

B、聚类半径

C、SSE

D、SSB

三、判断题(共8题,40分)

1.通过BIRCH聚类算法处理过的数据需要进行离群值的处理。( )

A、对

B、错

2.从数据中发现关联规则的问题可以转变为发现频繁项目集。( )

A、对

B、错

3.如果将自回归模型和移动平均模型结合,就能得到一个既包含自回归又包含移动平均的更精确的时间序列分析方法。( )

A、对

B、错

4.当提升度小于1时表明其中一个项集的出现降低了另一个项集出现的可能性。( )

A、对

B、错

5.聚类中相似或不相似是基于数据描述属性的取值来确定的。( )

A、对

B、错

6.如果当前时间点的值需要通过前两个时间点值的回归加上随机误差来计算,则称之为二阶自回归AR(2)。( )

A、对

B、错

7.对于时间序列的测量值,既可以是连续数据也可以是离散数据。( )

A、对

B、错

8.简单移动平均法的各元素的权重要有所差别。( )

A、对

B、错

东财《数据分析与决策》单元作业二

共20道题 总分:100分

一、单选题(共4题,20分)

1.两步聚类算法是一种( )算法。

A、分层聚类

B、K均值聚类

C、凝聚聚类

D、Kohonen network

2.CARMA算法只需要对数据进行( )次扫描就可以获得比Apriori算法更低的支持度的结果。

A、一

B、两

C、三

D、四

3.通常,我们期望聚类的数量不能( )。

A、太多

B、太少

C、固定

D、太随机

4.对于简单指数平滑法的模型,当( )时,表示模型更具有惰性。

A、α=0

B、α=1

C、α>0

D、α<0

二、多选题(共8题,40分)

1.衡量关联规则强弱的指标主要有( )。

A、支持度

B、置信度

C、相似度

D、提升度

2.决定选择何种时间序列分析法的原则包括( )。

A、要解决的问题

B、目的

C、时间

D、时间序列数据的特点

3.时间序列的特征主要有( )。

A、趋势

B、季节性周期性变化

C、连续值

D、离群值

4.K均值聚类算法的基本思想包括( )。

A、首先,随机选择K个对象,每个对象初始的代表了一个簇的均值

B、对剩余的每个对象,根据其与各个簇中心的距离,将它赋给最近的簇

C、然后重新计算每个簇的平均值

D、这个过程不断重复,直到准则函数收敛

5.K均值聚类算法的输入包括( )。

A、聚类个数K

B、初始中心

C、n个数据对象

D、方差

6.发现关联规则的步骤是( )。

A、预选指定一个最小支持度计数阈值

B、找到所有超过这个值的项目集

C、从频繁项目集中产生强关联规则

D、从频繁项目集中产生弱关联规则

7.分层聚类可细分为( )。

A、凝聚聚类

B、两步聚类

C、分裂聚类

D、K均值聚类

8.考察聚类内的特征主要有( )。

A、标准差

B、聚类半径

C、SSE

D、SSB

三、判断题(共8题,40分)

1.从数据中发现关联规则的问题可以转变为发现频繁项目集。( )

A、对

B、错

2.分层聚类是尝试建立分层以达到聚类的一类算法。( )

A、对

B、错

3.当提升度小于1时表明其中一个项集的出现降低了另一个项集出现的可能性。( )

A、对

B、错

4.移动平均模型描述的是自回归部分的误差累计。( )

A、对

B、错

5.计算聚类内的每个点至聚类中心点的距离平均值,如果聚类平均值过小,则说明这个聚类需要进一步分割。( )

A、对

B、错

6.如果当前时间点的值需要通过前两个时间点值的回归加上随机误差来计算,则称之为二阶自回归AR(2)。( )

A、对

B、错

7.时间序列中带有趋势和季节性因素都会给时间序列的分析和预测带来麻烦。( )

A、对

B、错

8.Apriori算法使用标准的发现关联规则的步骤,先发现数据中的频繁项目集,然后从中产生关联规则。( )

A、对

B、错

东财《数据分析与决策》单元作业二

共20道题 总分:100分

一、单选题(共4题,20分)

1.采样的时间间隔越短,数据的丢失就( )。

A、越多

B、越少

C、越不确定

D、没有影响

2.下列对于时间序列理解错误的是( )。

A、大多数时间序列都是平稳的

B、时间序列是通过定期测量时间段中某个变量获得的一组观察值

C、公司每年的红利属于离散时间序列

D、季节周期与序列的时间间隔相联系

3.当提升度( )时,称为正相关规则。

A、等于0

B、等于1

C、大于1

D、小于1

4.下列关于CARMA算法步骤的算法中错误的是( )。

A、在估计阶段的表格中记录项目集之间的关系

B、在验证阶段,需要计算候选项目集的规模

C、验证的第一步是将非频繁项目集从表格中删除

D、验证阶段的删除方式和表格裁剪方式相同

二、多选题(共8题,40分)

1.衡量关联规则强弱的指标主要有( )。

A、支持度

B、置信度

C、相似度

D、提升度

2.通过霍尔特指数平滑法可以处理( )的趋势。

A、随机

B、固定

C、非线性

D、线性

3.下列关于K均值算法理解正确的有( )。

A、K均值聚类算法是高效的,但是比较缓慢

B、K均值算法使簇内对象具有较高的相似度

C、K均值算法使簇间的相似度较低

D、K均值聚类算法的相似度的计算是根据一个簇中对象的平均值进行的

4.利用时间散点图可以分析时间序列是否存在( )。

A、趋势

B、季节性变化

C、离群值

D、缺失值

5.时间序列的特征主要有( )。

A、趋势

B、季节性周期性变化

C、连续值

D、离群值

6.CARMA算法在估计阶段,保存项目集信息的表格初始时,会按照( )步骤更新。

A、增加统计量

B、插入项目集

C、裁剪表格

D、删除表格

7.两步聚类算法的步骤为( )。

A、预聚类

B、归一化处理

C、离散值处理

D、聚类

8.下列选项中列出的聚类算法能很好处理大批量数据的有( )。

A、BIRCH聚类算法

B、分层聚类算法

C、两步聚类算法

D、K均值聚类算法

三、判断题(共8题,40分)

1.两步聚类算法主要处理较大规模的数据,可自动确定类的数目,能处理连续变量和分类变量的混合数据。( )

A、对

B、错

2.越低的最小支持度阈值产生的关联规则数量越少。

A、对

B、错

3.聚类中同一个组内的数据对象的相似性较低。( )

A、对

B、错

4.通过BIRCH聚类算法处理过的数据需要进行离群值的处理。( )

A、对

B、错

5.从数据中发现关联规则的问题可以转变为发现频繁项目集。( )

A、对

B、错

6.如果将自回归模型和移动平均模型结合,就能得到一个既包含自回归又包含移动平均的更精确的时间序列分析方法。( )

A、对

B、错

7.聚类中相似或不相似是基于数据描述属性的取值来确定的。( )

A、对

B、错

8.简单移动平均法的各元素的权重要有所差别。( )

A、对

B、错

东财《数据分析与决策》单元作业二

共20道题 总分:100分

一、单选题(共4题,20分)

1.两步聚类算法是一种( )算法。

A、分层聚类

B、K均值聚类

C、凝聚聚类

D、Kohonen network

2.CARMA算法只需要对数据进行( )次扫描就可以获得比Apriori算法更低的支持度的结果。

A、一

B、两

C、三

D、四

3.通常,我们期望聚类的数量不能( )。

A、太多

B、太少

C、固定

D、太随机

4.对于简单指数平滑法的模型,当( )时,表示模型更具有惰性。

A、α=0

B、α=1

C、α>0

D、α<0

二、多选题(共8题,40分)

1.衡量关联规则强弱的指标主要有( )。

A、支持度

B、置信度

C、相似度

D、提升度

2.决定选择何种时间序列分析法的原则包括( )。

A、要解决的问题

B、目的

C、时间

D、时间序列数据的特点

3.时间序列的特征主要有( )。

A、趋势

B、季节性周期性变化

C、连续值

D、离群值

4.K均值聚类算法的基本思想包括( )。

A、首先,随机选择K个对象,每个对象初始的代表了一个簇的均值

B、对剩余的每个对象,根据其与各个簇中心的距离,将它赋给最近的簇

C、然后重新计算每个簇的平均值

D、这个过程不断重复,直到准则函数收敛

5.K均值聚类算法的输入包括( )。

A、聚类个数K

B、初始中心

C、n个数据对象

D、方差

6.发现关联规则的步骤是( )。

A、预选指定一个最小支持度计数阈值

B、找到所有超过这个值的项目集

C、从频繁项目集中产生强关联规则

D、从频繁项目集中产生弱关联规则

7.分层聚类可细分为( )。

A、凝聚聚类

B、两步聚类

C、分裂聚类

D、K均值聚类

8.考察聚类内的特征主要有( )。

A、标准差

B、聚类半径

C、SSE

D、SSB

三、判断题(共8题,40分)

1.从数据中发现关联规则的问题可以转变为发现频繁项目集。( )

A、对

B、错

2.分层聚类是尝试建立分层以达到聚类的一类算法。( )

A、对

B、错

3.当提升度小于1时表明其中一个项集的出现降低了另一个项集出现的可能性。( )

A、对

B、错

4.移动平均模型描述的是自回归部分的误差累计。( )

A、对

B、错

5.计算聚类内的每个点至聚类中心点的距离平均值,如果聚类平均值过小,则说明这个聚类需要进一步分割。( )

A、对

B、错

6.如果当前时间点的值需要通过前两个时间点值的回归加上随机误差来计算,则称之为二阶自回归AR(2)。( )

A、对

B、错

7.时间序列中带有趋势和季节性因素都会给时间序列的分析和预测带来麻烦。( )

A、对

B、错

8.Apriori算法使用标准的发现关联规则的步骤,先发现数据中的频繁项目集,然后从中产生关联规则。( )

A、对

B、错

东财《数据分析与决策》单元作业二

共20道题 总分:100分

一、单选题(共4题,20分)

1.采样的时间间隔越短,数据的丢失就( )。

A、越多

B、越少

C、越不确定

D、没有影响

2.下列对于时间序列理解错误的是( )。

A、大多数时间序列都是平稳的

B、时间序列是通过定期测量时间段中某个变量获得的一组观察值

C、公司每年的红利属于离散时间序列

D、季节周期与序列的时间间隔相联系

3.当提升度( )时,称为正相关规则。

A、等于0

B、等于1

C、大于1

D、小于1

4.下列关于CARMA算法步骤的算法中错误的是( )。

A、在估计阶段的表格中记录项目集之间的关系

B、在验证阶段,需要计算候选项目集的规模

C、验证的第一步是将非频繁项目集从表格中删除

D、验证阶段的删除方式和表格裁剪方式相同

二、多选题(共8题,40分)

1.衡量关联规则强弱的指标主要有( )。

A、支持度

B、置信度

C、相似度

D、提升度

2.通过霍尔特指数平滑法可以处理( )的趋势。

A、随机

B、固定

C、非线性

D、线性

3.下列关于K均值算法理解正确的有( )。

A、K均值聚类算法是高效的,但是比较缓慢

B、K均值算法使簇内对象具有较高的相似度

C、K均值算法使簇间的相似度较低

D、K均值聚类算法的相似度的计算是根据一个簇中对象的平均值进行的

4.利用时间散点图可以分析时间序列是否存在( )。

A、趋势

B、季节性变化

C、离群值

D、缺失值

5.时间序列的特征主要有( )。

A、趋势

B、季节性周期性变化

C、连续值

D、离群值

6.CARMA算法在估计阶段,保存项目集信息的表格初始时,会按照( )步骤更新。

A、增加统计量

B、插入项目集

C、裁剪表格

D、删除表格

7.两步聚类算法的步骤为( )。

A、预聚类

B、归一化处理

C、离散值处理

D、聚类

8.下列选项中列出的聚类算法能很好处理大批量数据的有( )。

A、BIRCH聚类算法

B、分层聚类算法

C、两步聚类算法

D、K均值聚类算法

三、判断题(共8题,40分)

1.两步聚类算法主要处理较大规模的数据,可自动确定类的数目,能处理连续变量和分类变量的混合数据。( )

A、对

B、错

2.越低的最小支持度阈值产生的关联规则数量越少。

A、对

B、错

3.聚类中同一个组内的数据对象的相似性较低。( )

A、对

B、错

4.通过BIRCH聚类算法处理过的数据需要进行离群值的处理。( )

A、对

B、错

5.从数据中发现关联规则的问题可以转变为发现频繁项目集。( )

A、对

B、错

6.如果将自回归模型和移动平均模型结合,就能得到一个既包含自回归又包含移动平均的更精确的时间序列分析方法。( )

A、对

B、错

7.聚类中相似或不相似是基于数据描述属性的取值来确定的。( )

A、对

B、错

8.简单移动平均法的各元素的权重要有所差别。( )

A、对

B、错

东财《数据分析与决策》单元作业二

共20道题 总分:100分

一、单选题(共4题,20分)

1.通常,用时间转换方法将季节性变化转换为( )。

A、加法季节性变化

B、减法季节性变化

C、乘法积极性变化

D、除法季节性变化

2.CARMA算法只需要对数据进行( )次扫描就可以获得比Apriori算法更低的支持度的结果。

A、一

B、两

C、三

D、四

3.Apriori算法中的发现频繁项目集步骤中,首先扫描数据,从中发现包含( )个项的项目集。

A、1

B、2

C、3

D、4

4.下列关于聚类的说法错误的是( )。

A、聚类分析适合探讨样本间相互关联关系从而对一个样本结构做一个初步的评价

B、聚类是一种监督的学习方法。

C、聚类不依赖于事先确定的数据类别

D、聚类是观察式学习

二、多选题(共8题,40分)

1.决定选择何种时间序列分析法的原则包括( )。

A、要解决的问题

B、目的

C、时间

D、时间序列数据的特点

2.利用时间散点图可以分析时间序列是否存在( )。

A、趋势

B、季节性变化

C、离群值

D、缺失值

3.时间序列的特征主要有( )。

A、趋势

B、季节性周期性变化

C、连续值

D、离群值

4.K均值聚类算法的输入包括( )。

A、聚类个数K

B、初始中心

C、n个数据对象

D、方差

5.BIRCH聚类算法在决定将某个记录划归到某个树上的节点时,会考虑该记录的( )特征。

A、变量的均值

B、变量的标准差

C、变量的方差

D、变量每个分类的个数

6.发现关联规则的步骤是( )。

A、预选指定一个最小支持度计数阈值

B、找到所有超过这个值的项目集

C、从频繁项目集中产生强关联规则

D、从频繁项目集中产生弱关联规则

7.同指数平滑法相比,自回归模型具有( )。

A、灵活性

B、通用性

C、可靠性

D、适用性

8.考察聚类内的特征主要有( )。

A、标准差

B、聚类半径

C、SSE

D、SSB

三、判断题(共8题,40分)

1.通过BIRCH聚类算法处理过的数据需要进行离群值的处理。( )

A、对

B、错

2.从数据中发现关联规则的问题可以转变为发现频繁项目集。( )

A、对

B、错

3.如果将自回归模型和移动平均模型结合,就能得到一个既包含自回归又包含移动平均的更精确的时间序列分析方法。( )

A、对

B、错

4.当提升度小于1时表明其中一个项集的出现降低了另一个项集出现的可能性。( )

A、对

B、错

5.聚类中相似或不相似是基于数据描述属性的取值来确定的。( )

A、对

B、错

6.如果当前时间点的值需要通过前两个时间点值的回归加上随机误差来计算,则称之为二阶自回归AR(2)。( )

A、对

B、错

7.对于时间序列的测量值,既可以是连续数据也可以是离散数据。( )

A、对

B、错

8.简单移动平均法的各元素的权重要有所差别。( )

A、对

B、错

东财《数据分析与决策》单元作业二

共20道题 总分:100分

一、单选题(共4题,20分)

1.两步聚类算法是一种( )算法。

A、分层聚类

B、K均值聚类

C、凝聚聚类

D、Kohonen network

2.CARMA算法只需要对数据进行( )次扫描就可以获得比Apriori算法更低的支持度的结果。

A、一

B、两

C、三

D、四

3.通常,我们期望聚类的数量不能( )。

A、太多

B、太少

C、固定

D、太随机

4.对于简单指数平滑法的模型,当( )时,表示模型更具有惰性。

A、α=0

B、α=1

C、α>0

D、α<0

二、多选题(共8题,40分)

1.衡量关联规则强弱的指标主要有( )。

A、支持度

B、置信度

C、相似度

D、提升度

2.决定选择何种时间序列分析法的原则包括( )。

A、要解决的问题

B、目的

C、时间

D、时间序列数据的特点

3.时间序列的特征主要有( )。

A、趋势

B、季节性周期性变化

C、连续值

D、离群值

4.K均值聚类算法的基本思想包括( )。

A、首先,随机选择K个对象,每个对象初始的代表了一个簇的均值

B、对剩余的每个对象,根据其与各个簇中心的距离,将它赋给最近的簇

C、然后重新计算每个簇的平均值

D、这个过程不断重复,直到准则函数收敛

5.K均值聚类算法的输入包括( )。

A、聚类个数K

B、初始中心

C、n个数据对象

D、方差

6.发现关联规则的步骤是( )。

A、预选指定一个最小支持度计数阈值

B、找到所有超过这个值的项目集

C、从频繁项目集中产生强关联规则

D、从频繁项目集中产生弱关联规则

7.分层聚类可细分为( )。

A、凝聚聚类

B、两步聚类

C、分裂聚类

D、K均值聚类

8.考察聚类内的特征主要有( )。

A、标准差

B、聚类半径

C、SSE

D、SSB

三、判断题(共8题,40分)

1.从数据中发现关联规则的问题可以转变为发现频繁项目集。( )

A、对

B、错

2.分层聚类是尝试建立分层以达到聚类的一类算法。( )

A、对

B、错

3.当提升度小于1时表明其中一个项集的出现降低了另一个项集出现的可能性。( )

A、对

B、错

4.移动平均模型描述的是自回归部分的误差累计。( )

A、对

B、错

5.计算聚类内的每个点至聚类中心点的距离平均值,如果聚类平均值过小,则说明这个聚类需要进一步分割。( )

A、对

B、错

6.如果当前时间点的值需要通过前两个时间点值的回归加上随机误差来计算,则称之为二阶自回归AR(2)。( )

A、对

B、错

7.时间序列中带有趋势和季节性因素都会给时间序列的分析和预测带来麻烦。( )

A、对

B、错

8.Apriori算法使用标准的发现关联规则的步骤,先发现数据中的频繁项目集,然后从中产生关联规则。( )

A、对

B、错

东财《数据分析与决策》单元作业二

共20道题 总分:100分

一、单选题(共4题,20分)

1.两步聚类算法是一种( )算法。

A、分层聚类

B、K均值聚类

C、凝聚聚类

D、Kohonen network

2.CARMA算法只需要对数据进行( )次扫描就可以获得比Apriori算法更低的支持度的结果。

A、一

B、两

C、三

D、四

3.通常,我们期望聚类的数量不能( )。

A、太多

B、太少

C、固定

D、太随机

4.对于简单指数平滑法的模型,当( )时,表示模型更具有惰性。

A、α=0

B、α=1

C、α>0

D、α<0

二、多选题(共8题,40分)

1.衡量关联规则强弱的指标主要有( )。

A、支持度

B、置信度

C、相似度

D、提升度

2.决定选择何种时间序列分析法的原则包括( )。

A、要解决的问题

B、目的

C、时间

D、时间序列数据的特点

3.时间序列的特征主要有( )。

A、趋势

B、季节性周期性变化

C、连续值

D、离群值

4.K均值聚类算法的基本思想包括( )。

A、首先,随机选择K个对象,每个对象初始的代表了一个簇的均值

B、对剩余的每个对象,根据其与各个簇中心的距离,将它赋给最近的簇

C、然后重新计算每个簇的平均值

D、这个过程不断重复,直到准则函数收敛

5.K均值聚类算法的输入包括( )。

A、聚类个数K

B、初始中心

C、n个数据对象

D、方差

6.发现关联规则的步骤是( )。

A、预选指定一个最小支持度计数阈值

B、找到所有超过这个值的项目集

C、从频繁项目集中产生强关联规则

D、从频繁项目集中产生弱关联规则

7.分层聚类可细分为( )。

A、凝聚聚类

B、两步聚类

C、分裂聚类

D、K均值聚类

8.考察聚类内的特征主要有( )。

A、标准差

B、聚类半径

C、SSE

D、SSB

三、判断题(共8题,40分)

1.从数据中发现关联规则的问题可以转变为发现频繁项目集。( )

A、对

B、错

2.分层聚类是尝试建立分层以达到聚类的一类算法。( )

A、对

B、错

3.当提升度小于1时表明其中一个项集的出现降低了另一个项集出现的可能性。( )

A、对

B、错

4.移动平均模型描述的是自回归部分的误差累计。( )

A、对

B、错

5.计算聚类内的每个点至聚类中心点的距离平均值,如果聚类平均值过小,则说明这个聚类需要进一步分割。( )

A、对

B、错

6.如果当前时间点的值需要通过前两个时间点值的回归加上随机误差来计算,则称之为二阶自回归AR(2)。( )

A、对

B、错

7.时间序列中带有趋势和季节性因素都会给时间序列的分析和预测带来麻烦。( )

A、对

B、错

8.Apriori算法使用标准的发现关联规则的步骤,先发现数据中的频繁项目集,然后从中产生关联规则。( )

A、对

B、错

东财《数据分析与决策》单元作业二

共20道题 总分:100分

一、单选题(共4题,20分)

1.通常,用时间转换方法将季节性变化转换为( )。

A、加法季节性变化

B、减法季节性变化

C、乘法积极性变化

D、除法季节性变化

2.CARMA算法只需要对数据进行( )次扫描就可以获得比Apriori算法更低的支持度的结果。

A、一

B、两

C、三

D、四

3.Apriori算法中的发现频繁项目集步骤中,首先扫描数据,从中发现包含( )个项的项目集。

A、1

B、2

C、3

D、4

4.下列关于聚类的说法错误的是( )。

A、聚类分析适合探讨样本间相互关联关系从而对一个样本结构做一个初步的评价

B、聚类是一种监督的学习方法。

C、聚类不依赖于事先确定的数据类别

D、聚类是观察式学习

二、多选题(共8题,40分)

1.决定选择何种时间序列分析法的原则包括( )。

A、要解决的问题

B、目的

C、时间

D、时间序列数据的特点

2.利用时间散点图可以分析时间序列是否存在( )。

A、趋势

B、季节性变化

C、离群值

D、缺失值

3.时间序列的特征主要有( )。

A、趋势

B、季节性周期性变化

C、连续值

D、离群值

4.K均值聚类算法的输入包括( )。

A、聚类个数K

B、初始中心

C、n个数据对象

D、方差

5.BIRCH聚类算法在决定将某个记录划归到某个树上的节点时,会考虑该记录的( )特征。

A、变量的均值

B、变量的标准差

C、变量的方差

D、变量每个分类的个数

6.发现关联规则的步骤是( )。

A、预选指定一个最小支持度计数阈值

B、找到所有超过这个值的项目集

C、从频繁项目集中产生强关联规则

D、从频繁项目集中产生弱关联规则

7.同指数平滑法相比,自回归模型具有( )。

A、灵活性

B、通用性

C、可靠性

D、适用性

8.考察聚类内的特征主要有( )。

A、标准差

B、聚类半径

C、SSE

D、SSB

三、判断题(共8题,40分)

1.通过BIRCH聚类算法处理过的数据需要进行离群值的处理。( )

A、对

B、错

2.从数据中发现关联规则的问题可以转变为发现频繁项目集。( )

A、对

B、错

3.如果将自回归模型和移动平均模型结合,就能得到一个既包含自回归又包含移动平均的更精确的时间序列分析方法。( )

A、对

B、错

4.当提升度小于1时表明其中一个项集的出现降低了另一个项集出现的可能性。( )

A、对

B、错

5.聚类中相似或不相似是基于数据描述属性的取值来确定的。( )

A、对

B、错

6.如果当前时间点的值需要通过前两个时间点值的回归加上随机误差来计算,则称之为二阶自回归AR(2)。( )

A、对

B、错

7.对于时间序列的测量值,既可以是连续数据也可以是离散数据。( )

A、对

B、错

8.简单移动平均法的各元素的权重要有所差别。( )

A、对

B、错

东财《数据分析与决策》单元作业二

共20道题 总分:100分

一、单选题(共4题,20分)

1.采样的时间间隔越短,数据的丢失就( )。

A、越多

B、越少

C、越不确定

D、没有影响

2.下列对于时间序列理解错误的是( )。

A、大多数时间序列都是平稳的

B、时间序列是通过定期测量时间段中某个变量获得的一组观察值

C、公司每年的红利属于离散时间序列

D、季节周期与序列的时间间隔相联系

3.当提升度( )时,称为正相关规则。

A、等于0

B、等于1

C、大于1

D、小于1

4.下列关于CARMA算法步骤的算法中错误的是( )。

A、在估计阶段的表格中记录项目集之间的关系

B、在验证阶段,需要计算候选项目集的规模

C、验证的第一步是将非频繁项目集从表格中删除

D、验证阶段的删除方式和表格裁剪方式相同

二、多选题(共8题,40分)

1.衡量关联规则强弱的指标主要有( )。

A、支持度

B、置信度

C、相似度

D、提升度

2.通过霍尔特指数平滑法可以处理( )的趋势。

A、随机

B、固定

C、非线性

D、线性

3.下列关于K均值算法理解正确的有( )。

A、K均值聚类算法是高效的,但是比较缓慢

B、K均值算法使簇内对象具有较高的相似度

C、K均值算法使簇间的相似度较低

D、K均值聚类算法的相似度的计算是根据一个簇中对象的平均值进行的

4.利用时间散点图可以分析时间序列是否存在( )。

A、趋势

B、季节性变化

C、离群值

D、缺失值

5.时间序列的特征主要有( )。

A、趋势

B、季节性周期性变化

C、连续值

D、离群值

6.CARMA算法在估计阶段,保存项目集信息的表格初始时,会按照( )步骤更新。

A、增加统计量

B、插入项目集

C、裁剪表格

D、删除表格

7.两步聚类算法的步骤为( )。

A、预聚类

B、归一化处理

C、离散值处理

D、聚类

8.下列选项中列出的聚类算法能很好处理大批量数据的有( )。

A、BIRCH聚类算法

B、分层聚类算法

C、两步聚类算法

D、K均值聚类算法

三、判断题(共8题,40分)

1.两步聚类算法主要处理较大规模的数据,可自动确定类的数目,能处理连续变量和分类变量的混合数据。( )

A、对

B、错

2.越低的最小支持度阈值产生的关联规则数量越少。

A、对

B、错

3.聚类中同一个组内的数据对象的相似性较低。( )

A、对

B、错

4.通过BIRCH聚类算法处理过的数据需要进行离群值的处理。( )

A、对

B、错

5.从数据中发现关联规则的问题可以转变为发现频繁项目集。( )

A、对

B、错

6.如果将自回归模型和移动平均模型结合,就能得到一个既包含自回归又包含移动平均的更精确的时间序列分析方法。( )

A、对

B、错

7.聚类中相似或不相似是基于数据描述属性的取值来确定的。( )

A、对

B、错

8.简单移动平均法的各元素的权重要有所差别。( )

A、对

B、错

东财《数据分析与决策》单元作业二

共20道题 总分:100分

一、单选题(共4题,20分)

1.两步聚类算法是一种( )算法。

A、分层聚类

B、K均值聚类

C、凝聚聚类

D、Kohonen network

2.CARMA算法只需要对数据进行( )次扫描就可以获得比Apriori算法更低的支持度的结果。

A、一

B、两

C、三

D、四

3.通常,我们期望聚类的数量不能( )。

A、太多

B、太少

C、固定

D、太随机

4.对于简单指数平滑法的模型,当( )时,表示模型更具有惰性。

A、α=0

B、α=1

C、α>0

D、α<0

二、多选题(共8题,40分)

1.衡量关联规则强弱的指标主要有( )。

A、支持度

B、置信度

C、相似度

D、提升度

2.决定选择何种时间序列分析法的原则包括( )。

A、要解决的问题

B、目的

C、时间

D、时间序列数据的特点

3.时间序列的特征主要有( )。

A、趋势

B、季节性周期性变化

C、连续值

D、离群值

4.K均值聚类算法的基本思想包括( )。

A、首先,随机选择K个对象,每个对象初始的代表了一个簇的均值

B、对剩余的每个对象,根据其与各个簇中心的距离,将它赋给最近的簇

C、然后重新计算每个簇的平均值

D、这个过程不断重复,直到准则函数收敛

5.K均值聚类算法的输入包括( )。

A、聚类个数K

B、初始中心

C、n个数据对象

D、方差

6.发现关联规则的步骤是( )。

A、预选指定一个最小支持度计数阈值

B、找到所有超过这个值的项目集

C、从频繁项目集中产生强关联规则

D、从频繁项目集中产生弱关联规则

7.分层聚类可细分为( )。

A、凝聚聚类

B、两步聚类

C、分裂聚类

D、K均值聚类

8.考察聚类内的特征主要有( )。

A、标准差

B、聚类半径

C、SSE

D、SSB

三、判断题(共8题,40分)

1.从数据中发现关联规则的问题可以转变为发现频繁项目集。( )

A、对

B、错

2.分层聚类是尝试建立分层以达到聚类的一类算法。( )

A、对

B、错

3.当提升度小于1时表明其中一个项集的出现降低了另一个项集出现的可能性。( )

A、对

B、错

4.移动平均模型描述的是自回归部分的误差累计。( )

A、对

B、错

5.计算聚类内的每个点至聚类中心点的距离平均值,如果聚类平均值过小,则说明这个聚类需要进一步分割。( )

A、对

B、错

6.如果当前时间点的值需要通过前两个时间点值的回归加上随机误差来计算,则称之为二阶自回归AR(2)。( )

A、对

B、错

7.时间序列中带有趋势和季节性因素都会给时间序列的分析和预测带来麻烦。( )

A、对

B、错

8.Apriori算法使用标准的发现关联规则的步骤,先发现数据中的频繁项目集,然后从中产生关联规则。( )

A、对

B、错

东财《数据分析与决策》单元作业二

共20道题 总分:100分

一、单选题(共4题,20分)

1.两步聚类算法是一种( )算法。

A、分层聚类

B、K均值聚类

C、凝聚聚类

D、Kohonen network

2.CARMA算法只需要对数据进行( )次扫描就可以获得比Apriori算法更低的支持度的结果。

A、一

B、两

C、三

D、四

3.通常,我们期望聚类的数量不能( )。

A、太多

B、太少

C、固定

D、太随机

4.对于简单指数平滑法的模型,当( )时,表示模型更具有惰性。

A、α=0

B、α=1

C、α>0

D、α<0

二、多选题(共8题,40分)

1.衡量关联规则强弱的指标主要有( )。

A、支持度

B、置信度

C、相似度

D、提升度

2.决定选择何种时间序列分析法的原则包括( )。

A、要解决的问题

B、目的

C、时间

D、时间序列数据的特点

3.时间序列的特征主要有( )。

A、趋势

B、季节性周期性变化

C、连续值

D、离群值

4.K均值聚类算法的基本思想包括( )。

A、首先,随机选择K个对象,每个对象初始的代表了一个簇的均值

B、对剩余的每个对象,根据其与各个簇中心的距离,将它赋给最近的簇

C、然后重新计算每个簇的平均值

D、这个过程不断重复,直到准则函数收敛

5.K均值聚类算法的输入包括( )。

A、聚类个数K

B、初始中心

C、n个数据对象

D、方差

6.发现关联规则的步骤是( )。

A、预选指定一个最小支持度计数阈值

B、找到所有超过这个值的项目集

C、从频繁项目集中产生强关联规则

D、从频繁项目集中产生弱关联规则

7.分层聚类可细分为( )。

A、凝聚聚类

B、两步聚类

C、分裂聚类

D、K均值聚类

8.考察聚类内的特征主要有( )。

A、标准差

B、聚类半径

C、SSE

D、SSB

三、判断题(共8题,40分)

1.从数据中发现关联规则的问题可以转变为发现频繁项目集。( )

A、对

B、错

2.分层聚类是尝试建立分层以达到聚类的一类算法。( )

A、对

B、错

3.当提升度小于1时表明其中一个项集的出现降低了另一个项集出现的可能性。( )

A、对

B、错

4.移动平均模型描述的是自回归部分的误差累计。( )

A、对

B、错

5.计算聚类内的每个点至聚类中心点的距离平均值,如果聚类平均值过小,则说明这个聚类需要进一步分割。( )

A、对

B、错

6.如果当前时间点的值需要通过前两个时间点值的回归加上随机误差来计算,则称之为二阶自回归AR(2)。( )

A、对

B、错

7.时间序列中带有趋势和季节性因素都会给时间序列的分析和预测带来麻烦。( )

A、对

B、错

8.Apriori算法使用标准的发现关联规则的步骤,先发现数据中的频繁项目集,然后从中产生关联规则。( )

A、对

B、错

东财《数据分析与决策》单元作业二

共20道题 总分:100分

一、单选题(共4题,20分)

1.两步聚类算法是一种( )算法。

A、分层聚类

B、K均值聚类

C、凝聚聚类

D、Kohonen network

2.CARMA算法只需要对数据进行( )次扫描就可以获得比Apriori算法更低的支持度的结果。

A、一

B、两

C、三

D、四

3.通常,我们期望聚类的数量不能( )。

A、太多

B、太少

C、固定

D、太随机

4.对于简单指数平滑法的模型,当( )时,表示模型更具有惰性。

A、α=0

B、α=1

C、α>0

D、α<0

二、多选题(共8题,40分)

1.衡量关联规则强弱的指标主要有( )。

A、支持度

B、置信度

C、相似度

D、提升度

2.决定选择何种时间序列分析法的原则包括( )。

A、要解决的问题

B、目的

C、时间

D、时间序列数据的特点

3.时间序列的特征主要有( )。

A、趋势

B、季节性周期性变化

C、连续值

D、离群值

4.K均值聚类算法的基本思想包括( )。

A、首先,随机选择K个对象,每个对象初始的代表了一个簇的均值

B、对剩余的每个对象,根据其与各个簇中心的距离,将它赋给最近的簇

C、然后重新计算每个簇的平均值

D、这个过程不断重复,直到准则函数收敛

5.K均值聚类算法的输入包括( )。

A、聚类个数K

B、初始中心

C、n个数据对象

D、方差

6.发现关联规则的步骤是( )。

A、预选指定一个最小支持度计数阈值

B、找到所有超过这个值的项目集

C、从频繁项目集中产生强关联规则

D、从频繁项目集中产生弱关联规则

7.分层聚类可细分为( )。

A、凝聚聚类

B、两步聚类

C、分裂聚类

D、K均值聚类

8.考察聚类内的特征主要有( )。

A、标准差

B、聚类半径

C、SSE

D、SSB

三、判断题(共8题,40分)

1.从数据中发现关联规则的问题可以转变为发现频繁项目集。( )

A、对

B、错

2.分层聚类是尝试建立分层以达到聚类的一类算法。( )

A、对

B、错

3.当提升度小于1时表明其中一个项集的出现降低了另一个项集出现的可能性。( )

A、对

B、错

4.移动平均模型描述的是自回归部分的误差累计。( )

A、对

B、错

5.计算聚类内的每个点至聚类中心点的距离平均值,如果聚类平均值过小,则说明这个聚类需要进一步分割。( )

A、对

B、错

6.如果当前时间点的值需要通过前两个时间点值的回归加上随机误差来计算,则称之为二阶自回归AR(2)。( )

A、对

B、错

7.时间序列中带有趋势和季节性因素都会给时间序列的分析和预测带来麻烦。( )

A、对

B、错

8.Apriori算法使用标准的发现关联规则的步骤,先发现数据中的频繁项目集,然后从中产生关联规则。( )

A、对

B、错

东财《数据分析与决策》单元作业二

共20道题 总分:100分

一、单选题(共4题,20分)

1.通常,用时间转换方法将季节性变化转换为( )。

A、加法季节性变化

B、减法季节性变化

C、乘法积极性变化

D、除法季节性变化

2.CARMA算法只需要对数据进行( )次扫描就可以获得比Apriori算法更低的支持度的结果。

A、一

B、两

C、三

D、四

3.Apriori算法中的发现频繁项目集步骤中,首先扫描数据,从中发现包含( )个项的项目集。

A、1

B、2

C、3

D、4

4.下列关于聚类的说法错误的是( )。

A、聚类分析适合探讨样本间相互关联关系从而对一个样本结构做一个初步的评价

B、聚类是一种监督的学习方法。

C、聚类不依赖于事先确定的数据类别

D、聚类是观察式学习

二、多选题(共8题,40分)

1.决定选择何种时间序列分析法的原则包括( )。

A、要解决的问题

B、目的

C、时间

D、时间序列数据的特点

2.利用时间散点图可以分析时间序列是否存在( )。

A、趋势

B、季节性变化

C、离群值

D、缺失值

3.时间序列的特征主要有( )。

A、趋势

B、季节性周期性变化

C、连续值

D、离群值

4.K均值聚类算法的输入包括( )。

A、聚类个数K

B、初始中心

C、n个数据对象

D、方差

5.BIRCH聚类算法在决定将某个记录划归到某个树上的节点时,会考虑该记录的( )特征。

A、变量的均值

B、变量的标准差

C、变量的方差

D、变量每个分类的个数

6.发现关联规则的步骤是( )。

A、预选指定一个最小支持度计数阈值

B、找到所有超过这个值的项目集

C、从频繁项目集中产生强关联规则

D、从频繁项目集中产生弱关联规则

7.同指数平滑法相比,自回归模型具有( )。

A、灵活性

B、通用性

C、可靠性

D、适用性

8.考察聚类内的特征主要有( )。

A、标准差

B、聚类半径

C、SSE

D、SSB

三、判断题(共8题,40分)

1.通过BIRCH聚类算法处理过的数据需要进行离群值的处理。( )

A、对

B、错

2.从数据中发现关联规则的问题可以转变为发现频繁项目集。( )

A、对

B、错

3.如果将自回归模型和移动平均模型结合,就能得到一个既包含自回归又包含移动平均的更精确的时间序列分析方法。( )

A、对

B、错

4.当提升度小于1时表明其中一个项集的出现降低了另一个项集出现的可能性。( )

A、对

B、错

5.聚类中相似或不相似是基于数据描述属性的取值来确定的。( )

A、对

B、错

6.如果当前时间点的值需要通过前两个时间点值的回归加上随机误差来计算,则称之为二阶自回归AR(2)。( )

A、对

B、错

7.对于时间序列的测量值,既可以是连续数据也可以是离散数据。( )

A、对

B、错

8.简单移动平均法的各元素的权重要有所差别。( )

A、对

B、错

东财《数据分析与决策》单元作业二

共20道题 总分:100分

一、单选题(共4题,20分)

1.采样的时间间隔越短,数据的丢失就( )。

A、越多

B、越少

C、越不确定

D、没有影响

2.下列对于时间序列理解错误的是( )。

A、大多数时间序列都是平稳的

B、时间序列是通过定期测量时间段中某个变量获得的一组观察值

C、公司每年的红利属于离散时间序列

D、季节周期与序列的时间间隔相联系

3.当提升度( )时,称为正相关规则。

A、等于0

B、等于1

C、大于1

D、小于1

4.下列关于CARMA算法步骤的算法中错误的是( )。

A、在估计阶段的表格中记录项目集之间的关系

B、在验证阶段,需要计算候选项目集的规模

C、验证的第一步是将非频繁项目集从表格中删除

D、验证阶段的删除方式和表格裁剪方式相同

二、多选题(共8题,40分)

1.衡量关联规则强弱的指标主要有( )。

A、支持度

B、置信度

C、相似度

D、提升度

2.通过霍尔特指数平滑法可以处理( )的趋势。

A、随机

B、固定

C、非线性

D、线性

3.下列关于K均值算法理解正确的有( )。

A、K均值聚类算法是高效的,但是比较缓慢

B、K均值算法使簇内对象具有较高的相似度

C、K均值算法使簇间的相似度较低

D、K均值聚类算法的相似度的计算是根据一个簇中对象的平均值进行的

4.利用时间散点图可以分析时间序列是否存在( )。

A、趋势

B、季节性变化

C、离群值

D、缺失值

5.时间序列的特征主要有( )。

A、趋势

B、季节性周期性变化

C、连续值

D、离群值

6.CARMA算法在估计阶段,保存项目集信息的表格初始时,会按照( )步骤更新。

A、增加统计量

B、插入项目集

C、裁剪表格

D、删除表格

7.两步聚类算法的步骤为( )。

A、预聚类

B、归一化处理

C、离散值处理

D、聚类

8.下列选项中列出的聚类算法能很好处理大批量数据的有( )。

A、BIRCH聚类算法

B、分层聚类算法

C、两步聚类算法

D、K均值聚类算法

三、判断题(共8题,40分)

1.两步聚类算法主要处理较大规模的数据,可自动确定类的数目,能处理连续变量和分类变量的混合数据。( )

A、对

B、错

2.越低的最小支持度阈值产生的关联规则数量越少。

A、对

B、错

3.聚类中同一个组内的数据对象的相似性较低。( )

A、对

B、错

4.通过BIRCH聚类算法处理过的数据需要进行离群值的处理。( )

A、对

B、错

5.从数据中发现关联规则的问题可以转变为发现频繁项目集。( )

A、对

B、错

6.如果将自回归模型和移动平均模型结合,就能得到一个既包含自回归又包含移动平均的更精确的时间序列分析方法。( )

A、对

B、错

7.聚类中相似或不相似是基于数据描述属性的取值来确定的。( )

A、对

B、错

8.简单移动平均法的各元素的权重要有所差别。( )

A、对

B、错

东财《数据分析与决策》单元作业二

共20道题 总分:100分

一、单选题(共4题,20分)

1.两步聚类算法是一种( )算法。

A、分层聚类

B、K均值聚类

C、凝聚聚类

D、Kohonen network

2.CARMA算法只需要对数据进行( )次扫描就可以获得比Apriori算法更低的支持度的结果。

A、一

B、两

C、三

D、四

3.通常,我们期望聚类的数量不能( )。

A、太多

B、太少

C、固定

D、太随机

4.对于简单指数平滑法的模型,当( )时,表示模型更具有惰性。

A、α=0

B、α=1

C、α>0

D、α<0

二、多选题(共8题,40分)

1.衡量关联规则强弱的指标主要有( )。

A、支持度

B、置信度

C、相似度

D、提升度

2.决定选择何种时间序列分析法的原则包括( )。

A、要解决的问题

B、目的

C、时间

D、时间序列数据的特点

3.时间序列的特征主要有( )。

A、趋势

B、季节性周期性变化

C、连续值

D、离群值

4.K均值聚类算法的基本思想包括( )。

A、首先,随机选择K个对象,每个对象初始的代表了一个簇的均值

B、对剩余的每个对象,根据其与各个簇中心的距离,将它赋给最近的簇

C、然后重新计算每个簇的平均值

D、这个过程不断重复,直到准则函数收敛

5.K均值聚类算法的输入包括( )。

A、聚类个数K

B、初始中心

C、n个数据对象

D、方差

6.发现关联规则的步骤是( )。

A、预选指定一个最小支持度计数阈值

B、找到所有超过这个值的项目集

C、从频繁项目集中产生强关联规则

D、从频繁项目集中产生弱关联规则

7.分层聚类可细分为( )。

A、凝聚聚类

B、两步聚类

C、分裂聚类

D、K均值聚类

8.考察聚类内的特征主要有( )。

A、标准差

B、聚类半径

C、SSE

D、SSB

三、判断题(共8题,40分)

1.从数据中发现关联规则的问题可以转变为发现频繁项目集。( )

A、对

B、错

2.分层聚类是尝试建立分层以达到聚类的一类算法。( )

A、对

B、错

3.当提升度小于1时表明其中一个项集的出现降低了另一个项集出现的可能性。( )

A、对

B、错

4.移动平均模型描述的是自回归部分的误差累计。( )

A、对

B、错

5.计算聚类内的每个点至聚类中心点的距离平均值,如果聚类平均值过小,则说明这个聚类需要进一步分割。( )

A、对

B、错

6.如果当前时间点的值需要通过前两个时间点值的回归加上随机误差来计算,则称之为二阶自回归AR(2)。( )

A、对

B、错

7.时间序列中带有趋势和季节性因素都会给时间序列的分析和预测带来麻烦。( )

A、对

B、错

8.Apriori算法使用标准的发现关联规则的步骤,先发现数据中的频繁项目集,然后从中产生关联规则。( )

A、对

B、错

东财《数据分析与决策》单元作业二

共20道题 总分:100分

一、单选题(共4题,20分)

1.通常,用时间转换方法将季节性变化转换为( )。

A、加法季节性变化

B、减法季节性变化

C、乘法积极性变化

D、除法季节性变化

2.CARMA算法只需要对数据进行( )次扫描就可以获得比Apriori算法更低的支持度的结果。

A、一

B、两

C、三

D、四

3.Apriori算法中的发现频繁项目集步骤中,首先扫描数据,从中发现包含( )个项的项目集。

A、1

B、2

C、3

D、4

4.下列关于聚类的说法错误的是( )。

A、聚类分析适合探讨样本间相互关联关系从而对一个样本结构做一个初步的评价

B、聚类是一种监督的学习方法。

C、聚类不依赖于事先确定的数据类别

D、聚类是观察式学习

二、多选题(共8题,40分)

1.决定选择何种时间序列分析法的原则包括( )。

A、要解决的问题

B、目的

C、时间

D、时间序列数据的特点

2.利用时间散点图可以分析时间序列是否存在( )。

A、趋势

B、季节性变化

C、离群值

D、缺失值

3.时间序列的特征主要有( )。

A、趋势

B、季节性周期性变化

C、连续值

D、离群值

4.K均值聚类算法的输入包括( )。

A、聚类个数K

B、初始中心

C、n个数据对象

D、方差

5.BIRCH聚类算法在决定将某个记录划归到某个树上的节点时,会考虑该记录的( )特征。

A、变量的均值

B、变量的标准差

C、变量的方差

D、变量每个分类的个数

6.发现关联规则的步骤是( )。

A、预选指定一个最小支持度计数阈值

B、找到所有超过这个值的项目集

C、从频繁项目集中产生强关联规则

D、从频繁项目集中产生弱关联规则

7.同指数平滑法相比,自回归模型具有( )。

A、灵活性

B、通用性

C、可靠性

D、适用性

8.考察聚类内的特征主要有( )。

A、标准差

B、聚类半径

C、SSE

D、SSB

三、判断题(共8题,40分)

1.通过BIRCH聚类算法处理过的数据需要进行离群值的处理。( )

A、对

B、错

2.从数据中发现关联规则的问题可以转变为发现频繁项目集。( )

A、对

B、错

3.如果将自回归模型和移动平均模型结合,就能得到一个既包含自回归又包含移动平均的更精确的时间序列分析方法。( )

A、对

B、错

4.当提升度小于1时表明其中一个项集的出现降低了另一个项集出现的可能性。( )

A、对

B、错

5.聚类中相似或不相似是基于数据描述属性的取值来确定的。( )

A、对

B、错

6.如果当前时间点的值需要通过前两个时间点值的回归加上随机误差来计算,则称之为二阶自回归AR(2)。( )

A、对

B、错

7.对于时间序列的测量值,既可以是连续数据也可以是离散数据。( )

A、对

B、错

8.简单移动平均法的各元素的权重要有所差别。( )

A、对

B、错

东财《数据分析与决策》单元作业二

共20道题 总分:100分

一、单选题(共4题,20分)

1.通常,用时间转换方法将季节性变化转换为( )。

A、加法季节性变化

B、减法季节性变化

C、乘法积极性变化

D、除法季节性变化

2.CARMA算法只需要对数据进行( )次扫描就可以获得比Apriori算法更低的支持度的结果。

A、一

B、两

C、三

D、四

3.Apriori算法中的发现频繁项目集步骤中,首先扫描数据,从中发现包含( )个项的项目集。

A、1

B、2

C、3

D、4

4.下列关于聚类的说法错误的是( )。

A、聚类分析适合探讨样本间相互关联关系从而对一个样本结构做一个初步的评价

B、聚类是一种监督的学习方法。

C、聚类不依赖于事先确定的数据类别

D、聚类是观察式学习

二、多选题(共8题,40分)

1.决定选择何种时间序列分析法的原则包括( )。

A、要解决的问题

B、目的

C、时间

D、时间序列数据的特点

2.利用时间散点图可以分析时间序列是否存在( )。

A、趋势

B、季节性变化

C、离群值

D、缺失值

3.时间序列的特征主要有( )。

A、趋势

B、季节性周期性变化

C、连续值

D、离群值

4.K均值聚类算法的输入包括( )。

A、聚类个数K

B、初始中心

C、n个数据对象

D、方差

5.BIRCH聚类算法在决定将某个记录划归到某个树上的节点时,会考虑该记录的( )特征。

A、变量的均值

B、变量的标准差

C、变量的方差

D、变量每个分类的个数

6.发现关联规则的步骤是( )。

A、预选指定一个最小支持度计数阈值

B、找到所有超过这个值的项目集

C、从频繁项目集中产生强关联规则

D、从频繁项目集中产生弱关联规则

7.同指数平滑法相比,自回归模型具有( )。

A、灵活性

B、通用性

C、可靠性

D、适用性

8.考察聚类内的特征主要有( )。

A、标准差

B、聚类半径

C、SSE

D、SSB

三、判断题(共8题,40分)

1.通过BIRCH聚类算法处理过的数据需要进行离群值的处理。( )

A、对

B、错

2.从数据中发现关联规则的问题可以转变为发现频繁项目集。( )

A、对

B、错

3.如果将自回归模型和移动平均模型结合,就能得到一个既包含自回归又包含移动平均的更精确的时间序列分析方法。( )

A、对

B、错

4.当提升度小于1时表明其中一个项集的出现降低了另一个项集出现的可能性。( )

A、对

B、错

5.聚类中相似或不相似是基于数据描述属性的取值来确定的。( )

A、对

B、错

6.如果当前时间点的值需要通过前两个时间点值的回归加上随机误差来计算,则称之为二阶自回归AR(2)。( )

A、对

B、错

7.对于时间序列的测量值,既可以是连续数据也可以是离散数据。( )

A、对

B、错

8.简单移动平均法的各元素的权重要有所差别。( )

A、对

B、错

东财《数据分析与决策》单元作业二

共20道题 总分:100分

一、单选题(共4题,20分)

1.采样的时间间隔越短,数据的丢失就( )。

A、越多

B、越少

C、越不确定

D、没有影响

2.下列对于时间序列理解错误的是( )。

A、大多数时间序列都是平稳的

B、时间序列是通过定期测量时间段中某个变量获得的一组观察值

C、公司每年的红利属于离散时间序列

D、季节周期与序列的时间间隔相联系

3.当提升度( )时,称为正相关规则。

A、等于0

B、等于1

C、大于1

D、小于1

4.下列关于CARMA算法步骤的算法中错误的是( )。

A、在估计阶段的表格中记录项目集之间的关系

B、在验证阶段,需要计算候选项目集的规模

C、验证的第一步是将非频繁项目集从表格中删除

D、验证阶段的删除方式和表格裁剪方式相同

二、多选题(共8题,40分)

1.衡量关联规则强弱的指标主要有( )。

A、支持度

B、置信度

C、相似度

D、提升度

2.通过霍尔特指数平滑法可以处理( )的趋势。

A、随机

B、固定

C、非线性

D、线性

3.下列关于K均值算法理解正确的有( )。

A、K均值聚类算法是高效的,但是比较缓慢

B、K均值算法使簇内对象具有较高的相似度

C、K均值算法使簇间的相似度较低

D、K均值聚类算法的相似度的计算是根据一个簇中对象的平均值进行的

4.利用时间散点图可以分析时间序列是否存在( )。

A、趋势

B、季节性变化

C、离群值

D、缺失值

5.时间序列的特征主要有( )。

A、趋势

B、季节性周期性变化

C、连续值

D、离群值

6.CARMA算法在估计阶段,保存项目集信息的表格初始时,会按照( )步骤更新。

A、增加统计量

B、插入项目集

C、裁剪表格

D、删除表格

7.两步聚类算法的步骤为( )。

A、预聚类

B、归一化处理

C、离散值处理

D、聚类

8.下列选项中列出的聚类算法能很好处理大批量数据的有( )。

A、BIRCH聚类算法

B、分层聚类算法

C、两步聚类算法

D、K均值聚类算法

三、判断题(共8题,40分)

1.两步聚类算法主要处理较大规模的数据,可自动确定类的数目,能处理连续变量和分类变量的混合数据。( )

A、对

B、错

2.越低的最小支持度阈值产生的关联规则数量越少。

A、对

B、错

3.聚类中同一个组内的数据对象的相似性较低。( )

A、对

B、错

4.通过BIRCH聚类算法处理过的数据需要进行离群值的处理。( )

A、对

B、错

5.从数据中发现关联规则的问题可以转变为发现频繁项目集。( )

A、对

B、错

6.如果将自回归模型和移动平均模型结合,就能得到一个既包含自回归又包含移动平均的更精确的时间序列分析方法。( )

A、对

B、错

7.聚类中相似或不相似是基于数据描述属性的取值来确定的。( )

A、对

B、错

8.简单移动平均法的各元素的权重要有所差别。( )

A、对

B、错

东财《数据分析与决策》单元作业二

共20道题 总分:100分

一、单选题(共4题,20分)

1.采样的时间间隔越短,数据的丢失就( )。

A、越多

B、越少

C、越不确定

D、没有影响

2.下列对于时间序列理解错误的是( )。

A、大多数时间序列都是平稳的

B、时间序列是通过定期测量时间段中某个变量获得的一组观察值

C、公司每年的红利属于离散时间序列

D、季节周期与序列的时间间隔相联系

3.当提升度( )时,称为正相关规则。

A、等于0

B、等于1

C、大于1

D、小于1

4.下列关于CARMA算法步骤的算法中错误的是( )。

A、在估计阶段的表格中记录项目集之间的关系

B、在验证阶段,需要计算候选项目集的规模

C、验证的第一步是将非频繁项目集从表格中删除

D、验证阶段的删除方式和表格裁剪方式相同

二、多选题(共8题,40分)

1.衡量关联规则强弱的指标主要有( )。

A、支持度

B、置信度

C、相似度

D、提升度

2.通过霍尔特指数平滑法可以处理( )的趋势。

A、随机

B、固定

C、非线性

D、线性

3.下列关于K均值算法理解正确的有( )。

A、K均值聚类算法是高效的,但是比较缓慢

B、K均值算法使簇内对象具有较高的相似度

C、K均值算法使簇间的相似度较低

D、K均值聚类算法的相似度的计算是根据一个簇中对象的平均值进行的

4.利用时间散点图可以分析时间序列是否存在( )。

A、趋势

B、季节性变化

C、离群值

D、缺失值

5.时间序列的特征主要有( )。

A、趋势

B、季节性周期性变化

C、连续值

D、离群值

6.CARMA算法在估计阶段,保存项目集信息的表格初始时,会按照( )步骤更新。

A、增加统计量

B、插入项目集

C、裁剪表格

D、删除表格

7.两步聚类算法的步骤为( )。

A、预聚类

B、归一化处理

C、离散值处理

D、聚类

8.下列选项中列出的聚类算法能很好处理大批量数据的有( )。

A、BIRCH聚类算法

B、分层聚类算法

C、两步聚类算法

D、K均值聚类算法

三、判断题(共8题,40分)

1.两步聚类算法主要处理较大规模的数据,可自动确定类的数目,能处理连续变量和分类变量的混合数据。( )

A、对

B、错

2.越低的最小支持度阈值产生的关联规则数量越少。

A、对

B、错

3.聚类中同一个组内的数据对象的相似性较低。( )

A、对

B、错

4.通过BIRCH聚类算法处理过的数据需要进行离群值的处理。( )

A、对

B、错

5.从数据中发现关联规则的问题可以转变为发现频繁项目集。( )

A、对

B、错

6.如果将自回归模型和移动平均模型结合,就能得到一个既包含自回归又包含移动平均的更精确的时间序列分析方法。( )

A、对

B、错

7.聚类中相似或不相似是基于数据描述属性的取值来确定的。( )

A、对

B、错

8.简单移动平均法的各元素的权重要有所差别。( )

A、对

B、错

东财《数据分析与决策》单元作业二

共20道题 总分:100分

一、单选题(共4题,20分)

1.通常,用时间转换方法将季节性变化转换为( )。

A、加法季节性变化

B、减法季节性变化

C、乘法积极性变化

D、除法季节性变化

2.CARMA算法只需要对数据进行( )次扫描就可以获得比Apriori算法更低的支持度的结果。

A、一

B、两

C、三

D、四

3.Apriori算法中的发现频繁项目集步骤中,首先扫描数据,从中发现包含( )个项的项目集。

A、1

B、2

C、3

D、4

4.下列关于聚类的说法错误的是( )。

A、聚类分析适合探讨样本间相互关联关系从而对一个样本结构做一个初步的评价

B、聚类是一种监督的学习方法。

C、聚类不依赖于事先确定的数据类别

D、聚类是观察式学习

二、多选题(共8题,40分)

1.决定选择何种时间序列分析法的原则包括( )。

A、要解决的问题

B、目的

C、时间

D、时间序列数据的特点

2.利用时间散点图可以分析时间序列是否存在( )。

A、趋势

B、季节性变化

C、离群值

D、缺失值

3.时间序列的特征主要有( )。

A、趋势

B、季节性周期性变化

C、连续值

D、离群值

4.K均值聚类算法的输入包括( )。

A、聚类个数K

B、初始中心

C、n个数据对象

D、方差

5.BIRCH聚类算法在决定将某个记录划归到某个树上的节点时,会考虑该记录的( )特征。

A、变量的均值

B、变量的标准差

C、变量的方差

D、变量每个分类的个数

6.发现关联规则的步骤是( )。

A、预选指定一个最小支持度计数阈值

B、找到所有超过这个值的项目集

C、从频繁项目集中产生强关联规则

D、从频繁项目集中产生弱关联规则

7.同指数平滑法相比,自回归模型具有( )。

A、灵活性

B、通用性

C、可靠性

D、适用性

8.考察聚类内的特征主要有( )。

A、标准差

B、聚类半径

C、SSE

D、SSB

三、判断题(共8题,40分)

1.通过BIRCH聚类算法处理过的数据需要进行离群值的处理。( )

A、对

B、错

2.从数据中发现关联规则的问题可以转变为发现频繁项目集。( )

A、对

B、错

3.如果将自回归模型和移动平均模型结合,就能得到一个既包含自回归又包含移动平均的更精确的时间序列分析方法。( )

A、对

B、错

4.当提升度小于1时表明其中一个项集的出现降低了另一个项集出现的可能性。( )

A、对

B、错

5.聚类中相似或不相似是基于数据描述属性的取值来确定的。( )

A、对

B、错

6.如果当前时间点的值需要通过前两个时间点值的回归加上随机误差来计算,则称之为二阶自回归AR(2)。( )

A、对

B、错

7.对于时间序列的测量值,既可以是连续数据也可以是离散数据。( )

A、对

B、错

8.简单移动平均法的各元素的权重要有所差别。( )

A、对

B、错

赞(0)
未经允许不得转载:奥鹏作业网 » 东财23秋《数据分析与决策》单元作业二【标准答案】

评论 抢沙发

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址