minoz 发表于 2015-10-26 08:38

MATLAB中cell数组的全面介绍(转)

由于工作需要,经常要处理大量的实验数据.基本都是由仪器导出来,随着社会发展的进步,人们获取数据的量在不断增长,很多人都是,现在已经是海量数据时代了...从cell使用说起
在读取文件的时候,cell数组(各种翻译都有,元胞数组,单元数组...直接无视)是Matlab的宠儿,基本都会出现,长期使用发现频率比struct高了不少~无论是Import Data还是使用textscan之类来获取数据.从长期使用高级语言的角度来说,特别是习惯了面向对象之后i,更习惯使用struct数组,概念也很相似,奈何现实是...我们先看一下Matlab在help给出的定义:
A cell array is a collection of containers called cells in which you can store different types of data.

精华之处就是在可以存储不同类型的数据.可以是Matlab的类型或者自定义的类型.cell数组的一些操作

[*]创建:直接使用{}以及cell(...)形式,另外 下标法赋值也可以.注意后两种可以预配内存,内存是空间连续的~
[*]读取内容:{下标}和(下标)区别在于类型()是cell数组 ,{}是实际类型.结果显示是一致的
[*]>> a={'啊',123,,,sym(1)}
[*]a =
[*]    '啊'               
[*]>> class(a{1})
[*]ans =
[*]char
[*]>> class(a(1))
[*]ans =
[*]cell
[*]>>
[*]C{5,3}{4,7}(:,4)
[*]解读: cell数组的一个元素为cell类型,包含一个普通矩阵类型
[*]x = C{5,3};      % x is a cell array
[*]y = x{4,7};      % y is also a cell array
[*]z = y(:,4)       % z is a standard array

复制代码

[*]调整内容:添加和删除与普通矩阵方法一致
[*]相关函数:
[*]celldisp:显示所有的内容
[*]cell:创建空的元胞数组
[*]cellplot:利用图形方式显示内容
[*]cell2mat:将数组转变成为普通的矩阵
[*]mat2cell:将数值矩阵转变成为cell数组
[*]num2cell:将数值数组转变成为cell数组
[*]cell2struct:将数组转变成为结构
[*]struct2cell:将结构转变为cell数组
[*]iscell:判断输入是否为cell数组
[*]cellfun:为cell数组的每个cell执行指定的函数 fun可以是特殊函数或者句柄
[*]days{1} = 'Sunday';    days{2} = 'Monday';
[*]days{3} = 'Tuesday';   days{4} = 'Wednesday';
[*]days{5} = 'Thursday';days{6} = 'Friday';
[*]days{7} = 'Saturday';
[*]
[*]shortNames = cellfun(@(x)x(1:3), days, 'UniformOutput', false)
[*]shortNames =
[*]    'Sun'    'Mon'    'Tue'    'Wed'    'Thu'    'Fri'    'Sat'

复制代码

[*]deal:将输入参数赋值给输出 = deal(X{:}) ->可以简化 = C{:}
cell数组的类型转换看到上面的那些类型转换函数,也许你会笑了,感觉也没有什么特别的,但是使用过这个cell数组的朋友,估计大部分都会有转换失败的经历-_-很坑爹的...

Cell Array and Struct Array
[*]s = cell2struct(c, fields, dim) cell数组转换为struct数组,注意fields为char数组或者cell数组,而且size(c,dim) == length(fields)   % If fields is a cell arraysize(c,dim) == size(fields,1)   % If fields is a char array这个经常错误就是fields类型以及dim不对
[*]   c = struct2cell(s)struct数组转换为cell数组 这个基本没有什么错误的


Matrix and Cell Array
c = mat2cell(x, m, n) 转换为 m行n列cell数组 m = cell2mat(c) 必须是同一类型,而且限制不可包含cell数组或object类型,但是struct结构是可以的(同样这个struct不含 cell和object类型,否则依旧出错)

Double and Cell Array
C = num2cell(A, ) 返回C的维数是numel(A)/prod(X,Y,...)   dimN 是一个整数,范围是1到ndims(A)
只有数值矩阵才可以直接转换为cell,没有供cell转为double的方法.这是非常让人恼火的!不过理解之后就知道,cell本来就是混合类型的,直接转向数值类型单一矩阵,这样是不合理的.通常如果是的确是数值类型的可以走以下路线:cell->cell2mat 这时候注意cell2mat的条件非cell和object.否则,循环或者cellfun处理.如果可以使用 cell2mat 或者cat(dim,c{:}).很多时候都很方便
Cell Arrays of Strings
单独列出了是因为很多时候都要接触这个,基本txt之类读取来的数值数据都是char的cell数组~
可以使用cell参数与字符有关的部分函数(基本都支持)

[*]cellstr      Convert a character array to a cell array of strings.会去除末尾空白
[*]char      Convert a cell array of strings to a character array. 会恢复转换时候失去的空白
[*]deblank   Remove trailing blanks from a string.
[*]iscellstr    Return true for acell array of strings.
[*]sort      排序.
[*]strcat连接字符.
[*]strcmp对比字符.
[*]strmatch 查找字符.
[*]strrep 替换字符
[*]regexp系列及accumarray支持行列向量.

读写
数据读取进来了,处理后当然是需要保存的,可是面对要求 你总是很无奈,要是可以.mat格式那个很好啊 可是大部分要求都是txt之类的.(不明白为什么呢 其实数据库之类Matlab也是支持的...唉,需求总是最后的注脚...)首 先要了解怎么情况会有cell数组产生:具体查看textscan 的说明.大文件的读取首先推荐这个函数,处理灵活可以省去很多功夫,具体的格式设置很关键!能够有效分离cell数据的结果方便处理~否则3000万个数据循环绝对是out of memory...尽量使用高级的IO读写...另外,7.0很多读取都是数值返回cell的char类型数组 7.6以上都使用double了,包括xlsread...
如果允许,xlswrite是最好的选择~大量数据测试的结果还是非常好的
在Matlab帮助里面的循环例子:
[*]mycell = { 'a' 1 2 3 ; 'b' 4 5 6 };
[*]= size(mycell);
[*]filename = 'celldata.dat';
[*]fid = fopen(filename, 'w');
[*]for row=1:nrows
[*]    fprintf(fid, '%s %d %d %d\n', mycell{row,:});
[*]end
[*]fclose(fid);

复制代码
仅有数值时候 可以考虑先cell2mat 然后csvwrite.
cellfun的例子可以参考Matlab公司的http://www.mathworks.cn/support/solutions/en/data/1-1190ZB/index.html?solution=1-1190ZB


总结
基本是就是总结了一下用法,特别是转换和保存方面的,相对于struct数组,由于Matlab中支持甚多,因此也就常用了.功能偏弱,但是基本按照规则,还是可以尽量减少出错的.
希望大家也交换一下使用的心得~
页: [1]
查看完整版本: MATLAB中cell数组的全面介绍(转)