![大数据分析与应用实战:统计机器学习之数据导向编程](https://wfqqreader-1252317822.image.myqcloud.com/cover/943/44509943/b_44509943.jpg)
上QQ阅读APP看书,第一时间看更新
1.3.3 数组
数组结构类似矩阵,但其为二维以上的数据对象,与向量、矩阵对象一样,每个元素的数据类型必须相同。套件{datasets}中有一个数组对象Titanic,它是关于泰坦尼克号船难的乘客统计数据。Titanic数据集是四维列联表(contingency table),其中各维的因子水平数分别是4、2、2及2(参见1.3.6节因子)。R默认会呈现最后两维(Age与Survived)的四种组合状况下,前面两维(Class与Sex)的二维频率分布(frequency distribution)表(频率也可称为频次),或称列联表。class()函数返回的类别名称table意指array,又因为各维因子水平数(经常)不一,故使用列表组织其各维度的名称向量。ftable()可呈现报刊杂志上常见的扁平式高维列联表,此函数将上述默认的呈现方式转换为前三个因子共16(4×2×2)行,列为最后一个因子的两个水平之扁平式四维列联表。读者可细心观察,两者仅是摆放方式不同,数值内容其实完全一致。
![](https://epubservercos.yuewen.com/027AFF/23721555909466506/epubprivate/OEBPS/Images/Figure-P39_19848.jpg?sign=1739086688-0aL1czeXbvXUArOPPEJT2oajAwIS0QnC-0-aa0c91550f491dc8d03783565f9dd5f4)
![](https://epubservercos.yuewen.com/027AFF/23721555909466506/epubprivate/OEBPS/Images/Figure-P40_19849.jpg?sign=1739086688-uQ7UsmN4hs30qMvp2o9ESD7dkfAyLmIH-0-f990b745fdaf446d530e6d151ae662e8)
![](https://epubservercos.yuewen.com/027AFF/23721555909466506/epubprivate/OEBPS/Images/Figure-P41_19850.jpg?sign=1739086688-VVQS6PWNbAIX8kZYSHKM4wHj1DRR8tQP-0-c8f98b31484afc433ec2c4675b7312e7)
· 数组创建函数是array(),语法如下:
myarray<-array(向量对象,dim=各维因子水平数所形成的数值向量,dimnames=各维因子水平名称的字符串向量所形成的列表)
![](https://epubservercos.yuewen.com/027AFF/23721555909466506/epubprivate/OEBPS/Images/Figure-P42_1703.jpg?sign=1739086688-Z0lxEcSlWM0Kf0A3OS4NALB7dwxeXI7E-0-2056940638cf5b7d756b85ff88f532bb)