木森研心提示您:看后求收藏(吾看中文5kzw.net),接着再看更方便。
凌志不甚在意地说道。在吃饭方面凌志一向是能简单就简单,填饱肚子就行,没什么太多要求。
吃完饭两人一起来到学院楼。
“唉,我最近做的那个实验有点不太顺利啊,怎么调都调不好,愁死我了。”
陈峰在路上随意抱怨道。
“什么bug?程序一直报错吗?你那个代码不是论文原作者提供的么,怎么还有bug么?”
两人虽然都学计算机专业,但是研究方向还是有很大差别。
陈峰研究的是医学图像处理,听他说具体是做将几千张眼球图片中有病变区域的图片挑选出来的课题。
按理说就是一个简单的二分类,也就是利用深度神经网络训练出一个模型,利用模型将图片分成有病变的和没病变的,但是凌志知道事情恐怕没那么简单。
“倒也不是报错,程序是能调得通的,就是跑不到原论文中叙述的效果,愁死了啊。”
“跑不到不也没关系么,你的数据集是你们师门自己搞的,跟原论文用到的数据集都不一样,尽量调就好,跑不到不是太正常了么。”
在计算机行业,数据集绝对是基础中的基础,实验效果好不好,数据集质量高不高是关键。
一份经过高质量预处理的数据集很可能使你的实验效果事半功倍,所以很多计算机专业的研究生在做实验时尽量会选择原作者公开的数据集,这样自己只需要专注编写自己的程序就可以了。
很多研究生凭借着这样的便利一口气发表了多篇论文,早早攒足了毕业条件。
然而还有一部分研究生走上了一条荆棘的道路,他们的研究领域并没有公开的数据集,甚至有的研究领域是个新兴领域,连怎么研究都还没有确定的路数,更别提数据集。
这种情况下研究生就需要自己采集自己的数据集,并且还要预处理,工作量之大是常人难以想象的。
很不幸,凌志和陈峰的研究方向都属于后者。