你的代码糟粕比精华要多得多
新的研究发现,一个程序的核心功能仅在于一小部分封装的代码。
如果你是一个软件开发人员,有人问你,你写的代码中有多少是真正在实现实际功能的,有多少是填充物、无价值的或者只是因为实际运行编程语言所需要的? 95%? 75%? 50%?都不是!新的研究发现,只有大约5%的代码是真正在提供核心功能。
研究人员认为,就像自然语言一样,一些——甚至可能是绝大多数——写下的代码其实对于功能是不起作用的。《stalks of wheat》一文的作者认为,只有一部分代码代表了功能的语义核心,我们称之为精华,而其他的则是糟粕。
该作者表示,一个功能的核心可以被封装于一个小型的关键字集合中,这被称为“minimum distinguishing subset” (“最小的区别化子集”)或MINSET。我们可以通过将方法分解为词素(即,通过空格或标点符号分隔代码),丢弃那些对函数行为不重要的内容,同时把剩下的映射到关键字中。然后将那些关键字导入到MINSET。
为了检验此理论,即MINSET中的代码只占全部代码的一小部分,研究人员下载了1000个来自Apache、Eclipse、GitHub和SourceForge最受欢迎的Java项目。在合计超过10亿行的Java代码中,先剔除简单的方法( tokens低于50)。就只剩下不到190万的不同方法,然后从中随机抽取10,000条,确定它们的MINSET。研究中使用的代码和数据可从Bitbucket下载。
以下为研究发现的主要结果
MINSETS出奇的小。方法的平均MINSET大小为1.55个关键字,最大值为6。
MINSET的大小并不随方法规模的增加而变大。事实上,如果只看最大的1000个方法,其平均和最大MINSET关键字分别为降到1.12和4,这表明,正如作者所言:“即便是对于一些异常庞大的方法,MINSET也是一项既独特又灵活有效的指标。”
大多数代码几乎尽是糟粕。平均来说,在一个方法中只有4.6%的独特词素可以位列MINSET。也就是说,95%以上的代码都是糟粕。
不过有几处关键的地方需要指出来。首先,MINSET本身是不可执行的:它只是表征了核心功能的代码的最小集合。剩下95%中的一些代码(前面称之为糟粕)也不是无用的,因为还需要它们来运行程序。其次,尽管这项研究仅着眼于Java代码,不过由于语言的相似性,作者表示这些发现应该也适用于其他语言,特别是C语言和C++。
关于此项工作的意义?研究人员指出了MINSETs的潜在应用:
潜在应用
改进代码搜索——MINSETs可用于基于相似查询的代码搜索结果排名。
智能IDE——具备了MINSETs索引数据库的IDE可用于提出类似的代码,支持自动代码填充,加快调试过程。
备选的编程形式——MINSETs可用于支持基于关键字的编程,也就是说,我们可以通过一个小型的关键字组来创建可用的代码。
【免责声明】本文部分系转载,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责,如涉及作品内容、版权和其它问题,请在30日内与我们联系,我们会予以重改或删除相关文章,以保证您的权益!
Java开发高端课程免费试学
大咖讲师+项目实战全面提升你的职场竞争力
- 海量实战教程
- 1V1答疑解惑
- 行业动态分析
- 大神学习路径图
相关推荐
更多 
							
							
						 
							 
									2015-10-15
 
							
							
						 
							
							
						 
            Java开班时间
- 
                    北京 丨 10月31日 火速抢座
- 
                    上海 丨 10月31日 火速抢座
- 
                    广州 丨 10月31日 火速抢座
- 
                    兰州 丨 10月31日 火速抢座
- 
                    杭州 丨 10月31日 火速抢座
- 
                    南京 丨 10月31日 火速抢座
- 
                    沈阳 丨 10月31日 火速抢座
- 
                    大连 丨 10月31日 火速抢座
- 
                    长春 丨 10月31日 火速抢座
- 
                    哈尔滨 丨 10月31日 火速抢座
- 
                    济南 丨 10月31日 火速抢座
- 
                    青岛 丨 10月31日 火速抢座
- 
                    烟台 丨 10月31日 火速抢座
- 
                    西安 丨 10月31日 火速抢座
- 
                    天津 丨 10月31日 火速抢座
- 
                    石家庄 丨 10月31日 火速抢座
- 
                    保定 丨 10月31日 火速抢座
- 
                    郑州 丨 10月31日 火速抢座
- 
                    合肥 丨 10月31日 火速抢座
- 
                    太原 丨 10月31日 火速抢座
- 
                    苏州 丨 10月31日 火速抢座
- 
                    武汉 丨 10月31日 火速抢座
- 
                    成都 丨 10月31日 火速抢座
- 
                    重庆 丨 10月31日 火速抢座
- 
                    厦门 丨 10月31日 火速抢座
- 
                    福州 丨 10月31日 火速抢座
- 
                    珠海 丨 10月31日 火速抢座
- 
                    南宁 丨 10月31日 火速抢座
- 
                    东莞 丨 10月31日 火速抢座
- 
                    贵阳 丨 10月31日 火速抢座
- 
                    昆明 丨 10月31日 火速抢座
- 
                    洛阳 丨 10月31日 火速抢座
- 
                    临沂 丨 10月31日 火速抢座
- 
                    潍坊 丨 10月31日 火速抢座
- 
                    运城 丨 10月31日 火速抢座
- 
                    呼和浩特丨10月31日 火速抢座
- 
                    长沙 丨 10月31日 火速抢座
- 
                    南昌 丨 10月31日 火速抢座
- 
                    宁波 丨 10月31日 火速抢座
- 
                    深圳 丨 10月31日 火速抢座
- 
                    大庆 丨 10月31日 火速抢座
 
					 
								 【热点话题】
						【热点话题】
					 
					 
								 
								 
                     
                     
             
             
             
             
                     
                     
                     
                     
                     
                    



 
				 
				 
				 
				 400-111-8989
				400-111-8989
			 
				 lihm@tedu.cn
				lihm@tedu.cn
			
 
	

 
			 
			 
			 
			 
			
			 
					 
					 
				 
					 
					