AI开放平台介绍&AI模型性能调优纪要

文-李红涛

1. 背景说明

AI在业务层由各种各样的模型发挥着神奇的价值。开发者一般基于TensorFlow、paddlepaddle等深度学习平台进行AI模型训练;

AI开发平台,一般为这些深度学习平台下的子产品,提供机器学习能力,解决一站式模型开发、生产预测的平台;

 

一般AI开发平台包括如下能力:

  • 数据能力:数据获取、数据预处理(ETL)、数据集管理、数据标注、数据增强…
  • 模型能力:模型管理、模型训练、模型验证、模型部署、模型处理、模型详情…
  • 算法能力:支持各种算法、深度学习、数据运算处理框架、预置模型、算法调用、对算法组合操作…
  • 部署能力:多重部署方式、在线部署、私有化部署、边缘端部署、灰度/增量/全量部署…
  • 其他能力:AI服务市场、工单客服、权限管理、工作流可视化…

某AI商品模型训练平台如下,包括数据中心、模型中心,核心框架如下:

 

2. 模型调优阶段

在整个模型训练、开发、发布等环节,都会涉及到模型调优问题,比如训练效率低、模型训练效果不好等;

2.1 训练阶段调优问题

1、美团AI团队利用TensorFlow评论WDL推荐模型,针对性能瓶颈分析与调优如下:

在使用TensorFlow训练WDL模型时,主要发现3个性能问题:

  • 每轮训练时,输入数据环节耗时过多,超过60%的时间用于读取数据。
  • 训练时产生的网络流量高,占用大量集群网络带宽资源,难以实现分布式性能线性加速。
  • Hadoop的默认参数配置导致glibc malloc变慢,一个保护malloc内存池的内核自旋锁成为性能瓶颈。

 深入底层熟悉框架、处理逻辑,定位问题,最后给出解决方案

针对第一个问题,解决办法是使用TensorFlow Dataset接口,该接口不再使用Python线程读数据,而是用C++线程实现,避免了Python GIL问题。

针对第二个问题,社区提供了批量读数据接口TFRecordReader.read_up_to,能够指定每次读数据的数量。我们设置每次读入1000条数据,使读数句接口被调用的频次从10000次降低到10次,每轮训练时延降低2-3倍。

针对第三个问题,发现Hadoop有一项默认的环境变量配置限制进程所能使用的glibc内存池个数为4个。通过社区查询了解,将MALLOC_ARENA_MAX的默认设置改为4之后,可以不至于VIRT增加很多,而且一般作业性能没有明显影响。但这个默认配置对于WDL深度学习作业影响很大,我们去掉了这个环境配置,malloc并发性能极大提升。经过测试,WDL模型的平均训练时间性能减少至原来的1/4。

 

2、神经网络性能调优方案

https://www.jianshu.com/p/69e73704a709

(1)数据增广
(2)图像预处理
(3)网络初始化
(4)训练过程中的技巧
(5)激活函数的选择
(6)不同正则化方法
(7)来自于数据的洞察
(8)集成多个深度网络

 

3、自动调参-深度学习模型的超参数自动化调优详解

https://cloud.tencent.com/developer/article/1528472

 

2.2 模型迭代阶段

1 、模型效果优化技巧

http://www.python88.com/topic/55243

 

2、模型预测性能调优:

http://vearne.cc/archives/39300

 

2.3 模型上线前性能评估

1、模型评估性能指标

https://blog.csdn.net/u014203453/article/details/77598997

错误率、精度

准确率(查准率)、召回率(查全率)

P-A曲线 (平衡点)

mAP值-对AP值的平均值

AP值-平均精度值

 

3. AI开放平台发展趋势

AI开放平台总体目标:解决的是效率问题。

效率的提升体现在:
1、开发前(数据自动化处理、导入提速、数据自动化标注等)
2、开发中(模型组件化、模型训练效率、模型管理效率、自动调参)
3、开发后(模型发布效率、模型推理、迭代更替管理等)

 

基于效率,看到三个发展趋势:
1、PaaS平台趋向SaaS化,在做更多应用层的打包方案。本质上更简单、不用开发者/商户做过多开发,实则打包才具有更多差异性、让用户有更多依赖;服务的差异化

2、用户角色兼容性,向更多非具备开发能力/弱开发能力的多角色提供服务;
小白用户/pm/运营(搞定模型训练、可视化操作一键部署 eg.站长、创业者、公司一线业务人员)
弱开发者(基于PaaS或S-Paas能力就能满足 大量的模型市场,模型服务商提供中上层的服务 可以很方便快速调整模型 或者导入新数据训练新模型)
高阶开发者(基于底层IaaS能力,完全自主开发所需能力)

3、生态优势建设
腾讯云、阿里云,都有基于自身的泛娱乐、电商商户体系做服务。
金山云深挖的政企、视频、游戏等。

 

4. 概念科普

机器学习,是人工智能的一个分支;

深度学习,是机器学习的一个重要分支;深度学习的概念源于人工神经网络的研究,但是并不完全等于传统神经网络。深度学习可以说是在传统神经网络基础上的升级,约等于神经网络。

神经网络,是人工神经网络的简称。人工神经网络(Artificial Neural Network,即ANN ),是20世纪80 年代以来人工智能领域兴起的研究热点。 它从信息处理角度对人脑神经元网络进行抽象, 建立某种简单模型,按不同的连接方式组成不同的网络。 在工程与学术界也常直接简称为神经网络或类神经网络。

算法,用作训练模型的基础原理性能力,比如CNN 图像检索中的找相同-相似近邻检索;

模型,基于业务场景需求导向,基于算法+数据训练的解决问题的模型;

算力,模型训练所需要的计算能力,一般主要依靠CPU、GPU提供算力;

 

 

扩展阅读:

百度飞浆AI Studio  https://aistudio.baidu.com/

阿里云PAI 机器学习平台 https://help.aliyun.com/product/30347.html?spm=a2c4g.11186623.6.540.15e77d61BMqXV5

华为云ModelArts  https://www.huaweicloud.com/product/modelarts.html

京东云NeuHub https://www.jdcloud.com/cn/neuhub/all

使用TensorFlow训练WDL模型性能问题定位与调优
https://tech.meituan.com/2018/04/08/tensorflow-performance-bottleneck-analysis-on-hadoop.html

神经网络性能调优方案  https://www.jianshu.com/p/69e73704a709

AI平台详细介绍 https://zhuanlan.zhihu.com/p/102581335

金山云业务分析纪要

文-李红涛

1. 云计算行业背景

云计算结构存在较大差异,美国云计算市场以SaaS为主,占比达到64%;而中国云计算市场SaaS占比仅为33%。

国内云计算渗透率偏低,未来公有云市场空间巨大。根据GGV报告显示,中国网民人数是美国的3.2倍,中国的线上零售规模是美国的1.3倍,公司数量是美国的5.8倍,但是IT领域的花费却是美国的18%左右,国内公有云的渗透率仅10%,美国公有云的渗透率22%。

2. 金山云美股市场被看好

截止2020.7.11涨幅超过发行价41%(25.97→36.64),市值达到75亿美金;

美股市场对公有云服务商业模式已经熟知,美股云服务头部企业如,亚马逊、微软、谷歌、Salesforce、Adobe等;

弗若斯特沙利文的数据显示,自2018年以来,中国已成为全球第二大云服务市场,而增速更是已超过第一大市场美国,且国内云计算的市场渗透率远不及美国,发展潜力巨大。2015至2019年,美国云服务市场规模的复合年增长率为21.3%;相比之下,同期中国云服务市场规模的复合年增长率为37.7%,相差超过16个百分点。金山云2018-2020复合年均增长率在65%左右;

 

3. 2018-2019全年营收明细

2018 营收22亿,净亏损17亿(百度云33亿)

每个Q营收都在增加。推动云+AI。同时去小米化战略;

头部业务:视频、游戏、在线教育、企业云服务

潜力业务:

金融行业,推出金山云供应链金融解决方案

医疗领域,推出CloudHIS智慧医疗云平台已经在仙桃市全面应用、多家三甲医院落地智慧医疗试点

传媒领域,与人民网、陕西广电等开展深度合作,打造智慧传媒云引擎;

AIoT领域,发布智慧人居解决方案,并与途家网签署战略合作协议等。

 

2019 营收39亿,净亏损11.6亿(百度云70亿,亏损15亿)

营收来源:总需求量提升,垂直领域、新领域的客户增加、主要客户平均收益增加

2019 财年底,小米系为金山云贡献了人民币5.7亿元收入,占总收入的14%;支持小米云基础服务,包括AI和IOT项目;

2019公有云服务营收34亿占比87%,企业云服务营收4.86亿占比13%;2019年Q3和Q4的调整后毛利率分别为2.1%和4.8%。

 

2020 Q1营收13.9亿,净亏损3.31亿,同比亏损负增长64.6%;

疫情期间开发新的行业解决方案,eg.在线医疗、教育、远程办公和娱乐;

其中公有云营业收入12.09亿元占比87%,同比增长58.4%;企业云营收1.82亿元占比13%,同比增长118.8%。

2020年Q1的调整后毛利率为5.3%,毛利相比2019持续提升;

 

2021、2022年营收预期

综合各家投行给出的数据来看,2021年金山云的收入将在65亿元左右,而2022年的收入则将进一步增至105亿元左右,继续保持超过60%的高速增长。

 

4. 业务营收健康度

营收主要来自公有云服务,企业云服务起步较晚

2019、2020Q1金山云营收87%公有云服务(互联网行业相关服务),13%企业云服务(传统企业的私有云、混合云服务);其中企业云服务增长加速明显;

云计算生态营收单一,过于依赖CDN提升营收

总营收年均复合增长65%+,主要依赖CDN内容加速服务,在线上游戏、视频流以及其他线上娱乐方面业务较多;

二线企业缺乏能够间接变现云计算投资的生态系统。依赖销售利润率低的产品和服务,以促进收入快速增长。CDN是四种主要 IaaS 产品中利润率最低的产品,其他三种是计算、数据库和存储。2017财年至2019财年,金山云公共云服务毛收入的 58%来自分发业务(大都是CDN 业务)。阿里巴巴从 2015 年开始下调 CDN 定价,CDN 服务价格每年下跌近20%。大部分 IaaS 公司出售 CDN 服务的价格仅略高于成本,甚至毛利率为负。

小米系在自身业务增长趋缓,为金山云贡献有限

2019年小米系为金山云营收贡献占比14%

5. 营收发力点

增强获客能力

行业解决方案将成为渗透新客户的关键;强化云+AI战略,推出更多垂直行业解决方案

加强营销和销售投入

多云策略的选择

越来越多的企业已开始采取“多云”策略,以保证云服务的可靠性和安全性。因此,作为独立于“AT”的金山云,其在一定程度上能够减少客户的这种顾虑。金山云的客户就已包括字节跳动、爱奇艺、哔哩哔哩等不少互联网行业的明星公司;

 

6. 行业竞对

阿里-万网、电商形成中小企业生态;

腾讯-游戏泛娱乐生态 (投资长亮科技 to b)

百度云-云计算、智能金融、智能客服、渠道生态、IOT;东软-深耕垂直行业解决方案(医疗、政企等)、宇信科技(to b领域,比如银行)

UCloud 优刻得,港股市值368亿港币(47亿美元,略低于金山云75亿美元)

金融领域竞对:

1、平安云-视觉能力-人脸、OCR是核心业务;

2、第四范式-智能化、大数据领域;

3、度小满-金科服务平台(对个人的风险评估更全面)、智能客服

 

其他领域竞对:

微擎—围绕微信等大平台建设的可视化服务集成运维管理平台,无技术要求,方便运营;其他类似平台包括,微盟、小猪cms、有赞、点点客、微动力、微信管家、微米、乐享等;

宝塔—服务器可视化管理工具,linux下此类服务非常多;webmin、云帮手、旗鱼云梯、AppNode等;

 

7. 附录:常用行业名词

SaaS,Software-as-a-Service,软件即服务,有较强的业务属性。在云计算领域,算最上层的行业解决方案;类似成品;

PaaS,Platform-as-a-Service,平台即服务,有相关的业务属性,服务更具有通用型或灵活性。在云计算领域,会推出通用型AI平台、垂直型智慧金融、智慧工业平台服务,包括各种模型训练平台、数据标注平台等便利工具;客户会基于该平台能力进行上层业务开发,无需操心底层服务运维等;类似半成品;

aPaaS和iPaaS都属于PaaS系统;

 

aPaaS,应用程序平台即服务,是趋向于SaaS和PaaS之间。aPaaS平台提供了一个安全的、自由的环境,可以快速轻松地构建数据库应用程序、开发应用程序扩展、创建web门户或部署现成的可定制库应用程序。

 

iPaaS,集成平台即服务,趋向于IaaS和PaaS之间。iPaaS可以简化组织的整体系统。通过创建虚拟平台,iPaaS连接应用程序和资源,用来创建一致的结构。iPaaS框架创建了跨多个云、云与传统应用程序之间的资源无缝集成。iPaaS不仅致力于在云内集成企业系统,而且还致力于公共云和私有云之间的集成。

IaaS,Infrastructure-as-a-Service,基础设施即服务,无业务属性,纯底层服务。比如CPU、内存、存储、网络和其它基本的计算资源,用户能够部署和运行任意软件,包括操作系统和应用程序。开发者更自由开发自己要的中层、上层服务,对开发要求极高; 

 

参考说明:

2018-2019营收明细https://www.sohu.com/a/388931157_114984

2018业务分部 https://www.iyiou.com/p/95822.html

未来营收预期 http://finance.sina.com.cn/stock/usstock/2020-06-12/doc-iirczymk6691256.shtml

小米系对金山云营收贡献 https://finance.sina.com.cn/stock/relnews/hk/2020-06-13/doc-iirczymk6858405.shtml

2019公有云市场排行

2019公有云市场排行

浅谈百亿规模的内容审核业务

趋势一:内容审查监管力度逐步加强

从2018年大家就应该能感受到网络内容审查力度越来越大。感兴趣可以自行百度查询下最近2年的监管翻车触发的相关事件;

 

趋势二:内容态互联网公司审查人力成本逐步加大

需要大力投入内容审核的产品,大部分是:新闻资讯、视频直播、社区、IM聊天、低频法布类等;

尤其是直播最容易翻车!时效性越快,越容易翻车!

 

从网络公开资料看,字节跳动 2019审核人员1w人。快手 2019审核人员0.8w人;了解到dau 1000w的一个产品,审核人员2020目前是1100+人。

假定

dau 2-3亿+,审核人员0.8w-1w+;

dau 1000w+,审核人员1000+;

dau 100w+,审核人员500+;

从全网APP榜单分布看,dau 100w+产品,共计417个,其中和内容相关产品占比42%;

从内容审核行业打听到,目前审核人力成本6.5k~7k每人月,取中位数6.75k,即年薪8.1w; (Google内容审核人员换算人民币是26w每人)

取APP dau100w+的榜单中位数,按照dau 1000w+预估,互联网内容审核大盘为 1000人*8.1w*417*42%=141亿

内容审核,也许是个百亿大盘的行业;

 

趋势三:AI辅助人工审核是趋势

内容审核集中类型:涉政、色敏低俗、暴恐、舆情等;

信息载体暴恐:文本、图片、视频、音频等;

涉及到技术包括:词表+视觉,最常用;

AI模型判断,会遇到的挑战:

人-低头、侧脸、PS特征、漫画、光线角度等,难度极大;需要数据持续迭代模型;

OCR-字体、水印各种变体、深浅不一,需要富集样本;

语音-音频合成,模拟某些人的声音;

长线看机会:

1、AI模型准确率越来越高,可以逐步解放人力;

预期AI模型可以准确解决掉80%-90%的审核case,剩余10%-20%的内容需要全人力审核;

2、AI模型标准的高标准化、可复用性;

相关模型的标准基本在国内是可以统一维护、迭代的;样本量越大,准确率越高,服务更稳定,门槛越高;

单独公司去维护迭代这一套东西,成本是很大的;比如某社区产品的色敏模型,据说研发人员30人团队进行维护;这个模型的研发维护成本每年720w-1000w;

 

好了,大概先盘了几点看法。大家有啥新的发现和坑,欢迎留言交流哈;

 

机器学习入门5:KNN近邻算法-图像检索-NN最近邻检索和ANN近似最近邻检索

本文是机器学习入门的基础版,学习对象产品经理同学;

目前图像检索中最基础的检索能力:

NN检索-最近邻检索(Nearest Neighbor Search)

ANN检索-近似最近邻检索Approximate Nearest Neighbor。区别于ANN

 

1.概述

最近邻检索就是根据数据的相似性,从数据库中寻找与目标数据最相似的项目。这种相似性通常会被量化到空间上数据之间的距离,可以认为数据在空间中的距离越近,则数据之间的相似性越高。

K最近邻(K-Nearest Neighbor,KNN)检索:当需要查找离目标数据最近的前k个数据项时。

最近邻检索是线性复杂度的,不能满足对于大规模数据检索的时间性能要求。

 

2.应用领域

起初应用于文档检索系统,最近邻检索作为具有查找相似性文档信息的方法;
随后在地理信息系统中,最近邻检索也被广泛应用于位置信息,空间数据关系的查询、分析与统计;
如今在图像检索、数据压缩、模式识别以及机器学习等领域都有非常重要的作用。
在图像处理与检索的研究中,基于内容的图像检索方法(CBIR)是目前的主流。

2.1 图像的内容是什么?

这里的“内容”是指:图像中包含的主要对象的几何形状、颜色强度、表面纹理等外在特性,以及前景与后景的对比程度等整体特征。

图像的描述方式:局部特征描述子(SIFT、SURF、BRIEF) ,全局特征描述子(GIST),特征频率直方图,纹理信息,显著性区域等。

最近邻检索的引入将图像检索转化到特征向量空间,通过查找与目标特征向量距离最近的向量来获得相应图像之间的关系。 这种特征向量之间的距离通常被定义为欧几里得距离(Euclidean distance),即是空间中两点之间的直线距离。

 

3.发展趋势

最近邻检索作为数据检索中使用最为广泛的技术一直以来都是国内外学者研究的热点。近些年,涌现出大量以最近邻检索或近似最近邻检索为基本思想的两类方法。一类是基于提升检索结构性能的方法,主要方法大多基于树形结构;另一类主要基于对数据本身的处理,包括哈希算法、矢量量化方法等。

3.1 最近邻检索(精确检索)

背景:精确检索中数据维度一般较低,所以会采用穷举搜索,即在数据库中依次计算其中样本与所查询数据之间的距离,抽取出所计算出来的距离最小的样本即为所要查找的最近邻。当数据量非常大的时候,搜索效率急剧下降。

基于树结构的最近邻检索方法

概述:由于实际数据会呈现出簇状的聚类形态,因此可以考虑对数据库中的样本数据构建数据索引,索引树就是最常见的方法。其基本思想是对搜索空间进行层次划分,再进行快速匹配。

结论:当数据维度不太高(如d< 20),通常采用树型索引结构对数据进行分区以实现高效索引,如最经典的KD树算法 、R树、M树等等,它们的时间和空间复杂度都是以d为指数的指数级别的,在实际搜索时也取得了良好的效果。

当d=1时,只要采用传统的二分查找法或者各类平衡树就能找到最近邻;
当d=2时,将最近邻检索问题转化为求解查询点究竟落在哪个区域的Voronoi图问题,再通过二分查找树就能很好的解决。

 

3.2 近似最近邻检索

背景:面对庞大的数据量以及数据库中高维的数据信息,现有的基于 NN 的检索方法无法获得理想的检索效果与可接受的检索时间。因此,研究人员开始关注近似最近邻检索(Approximate Nearest Neighbor,ANN)。

概述:近似最近邻检索利用数据量增大后数据之间会形成簇状聚集分布的特性,通过对数据分析聚类的方法对数据库中的数据进行分类或编码,对于目标数据根据其数据特征预测其所属的数据类别,返回类别中的部分或全部作为检索结果。

近似最近邻检索的核心思想:搜索可能是近邻的数据项而不再只局限于返回最可能的项目,在牺牲可接受范围内的精度的情况下提高检索效率。

分类
一种是采用哈希散列的办法,另一种则是矢量量化。

3.2.1 局部敏感哈希(LSH)
核心思想:在高维空间相邻的数据经过哈希函数的映射投影转化到低维空间后,他们落入同一个吊桶的概率很大而不相邻的数据映射到同一个吊桶的概率则很小。在检索时将欧式空间的距离计算转化到汉明(Hamming)空间,并将全局检索转化为对映射到同一个吊桶中的数据进行检索,从而提高了检索速度。这种方法的主要难点在于如何寻找适合的哈希函数。

3.2.2 矢量量化
其代表是乘积量化(PQ)。它的主要思想是将特征向量进行正交分解,在分解后的低维正交子空间上进行量化,由于低维空间可以采用较小的码本进行编码,因此可以降低数据存储空间 。

PQ方法采用基于查找表的非对称距离计算(Asymmetric Distance Computation,ADC)快速求取特征向量之间的距离,在压缩比相同的情况下,与采用汉明距离的二值编码方法,采用ADC的PQ方法的检索精度更高。

感谢参考文献 

我女儿和人工智能的思考

上篇:聊下我的女儿
满满,纯种人类,5月26日2岁。

0-6个月 哭
1.肚子饿了
2.哪里不舒服,需要帮忙处理

6-12个月 自己的语言、学习站立行走
1.咿咿呀呀,完全是婴儿世界独有的语言,成年人不懂。我有录音,试着后续翻译出来。
2.天生会叫mama,这让我理解了,妈妈读音的来源。同时也发现其他国家针对妈妈母亲的读音大多数都mama,所以这个不是巧合。
3.爬行阶段到站立行走,感觉是满周岁就开始会站立了,两步、三步…

1岁-1岁6个月 语言和校正、人物(称呼)识别、模仿学习、执行命令、自我意识(思维)
1.开始学习叫baba,但还不清楚babamama是哪一位,逐步通过不断校正反馈学习,进行人物(称呼)识别
2.开始校正自己的语言,逐渐演变为成年人大概能理解的语言
3.开始探索世界,进行对话发问:“这是什么呀?”
4.开始模仿学习。看到小朋友会的动作,回来后自己就会了。学习打电话,拿着任何东西,任何时刻都可以立马开始变为打电话姿势,并和“对方”对话;敲击电脑、开手机等
5.开始执行命令做任务。帮忙拿东西,识别语言命令,识别物体,识别任务流程等
6.开始自我意识(思维)。比如爸爸开门回家,主动拿包往屋里拖;

重点说下自我意识(思维)阶段:
这个阶段是我觉得人类最神奇的地方,非常非常让我惊喜意外。这个过程没有大人教导,完全是女儿自我意识触发的举动。例子太多太多,女儿每次产生独立意识行为的时候,都让我非常吃惊。

1岁6个月-2岁  任务参与感、兴趣
1.希望参与一切任务,积极搭把手,一起协作
2.喜欢拿笔涂画,画线条,还不是成年人理解的图形,但还是有很自如的美感

满满画画

满满画画

2岁+ 语言能力爆棚、模仿能力
1.长句子,只要有人教一遍,随口就会,包括英语,也会跟着有模有样的重复读,虽然不知道什么意思
2.模仿其他小孩做的游戏,即时大人看着很重复无聊的一个游戏,她也会觉得非常开心

下篇:聊下人工智能机器人

BBC研究的智能机器人发展阶段
0.编程人员0和1的程序。智能取决于编程者
1.自己的语言。产生机器人自己的语言,区别于人类语系。
2.语言校正学习。和同类机器人用自己的语言对话,校正确认语言的命令识别的关联性
3.做任务。发出命令到执行
4.自我意识。这个阶段还尚未实现。这个阶段也是我非常惊讶于我女儿在1岁6个月时候拥有的能力。
BBC地平线:探寻人工智能.BBC.Horizon.2012.The.Hunt.for.AI.中英字幕

目前人工智能类产品:
1.微软小冰。语料库、人脸识别、大数据学习,整个过程不断建模进行case学习,不停矫正学习。
2.百度度秘。针对一个垂直领域的关键词提取,进行自动回复相关O2O服务。
3.阿里小AI。在《我是歌手4》期间大量PR宣传自己拥有歌王预测能力。初步分析是不断对已经发生的事情和之前历史数据进行整体舆情分析、包括音乐能力识别,综合起来做的一个接近实时的历史数据分析和推演,还无法做到在某场比赛开始前下定论预测比赛结果。

人工智能发展现状观点:
目前人工智能类产品,还处在对语意的识别、理解,这个过程还不是很成熟。还需要不断建立case库进行深度学习。
非常期待人工智能的自我意识阶段,拥有独立的思维:发现、判断、决策、行动。

也希望目前发展中的一些智能产品,别吹牛逼了,做到什么程度就说什么程度的话。

有突破总是令人惊喜的,不是吗?

结语:
感谢女儿带给我一起成长,一起学习、探索的过程。
如果要研究人工智能,请一定先养一个孩子。没有孩子,没有发言权,或者很难有新研究成就:)
最后送给我身边不打算要小孩的大哥大姐,大多数是宁可养小动物,也不养小孩。
其实,小孩比小动物好玩多了,过程自己体会吧。不要拿担心不能给孩子将来作为借口,也许是小孩给你将来,将来是未知数,没有过怎么知道将来结果呢!