Tag Archives: nsfc

机器学习用于验证码识别

看了几个机器学习的东西,其中一个是Tesseract,ocr可以用于转换图片到文字。这几天在考虑国家自然科学基金,里面查项目一项有个简单的验证码,十分讨厌,所以以这个为例,试着用了一下,写了个小代码。调用了Tesseract用于ocr,Magick convert用于图片转换,识别率还是比较高 (如果对Tesseract专门训练可能效果更好,但我简单看了一下还是蛮复杂的样子)。这意味着理论上我们就可以把国自项目的信息全部爬下来,不过没有时间去弄。

  • Qt 5/ Mingw环境。
  • ImageMagick-7.0.7-22-portable-Q16-x86
  • Tesseract-OCR-4.0.0alpha

一些截图:

Image(2)[4]Image(6)Image(7)Image(8)

各种基金动员会

院、学校自12月以后各种基金动员,比如刚才收到的一个信息:“今天下午的基金动员大会非常重要,学校邀请了两位校外著名专家来传经送道机会难得!请各位院长再次通知符合申报条件教授必须参加。” 让人疑惑难道基金难道动员出来的?花大钱请了的大牛们如果没了大牛的光环,他们写的基金估计命中率也高不到哪儿去。基金是潜心思考、认真撰写出来的,跟动员无关!

因为学校重视国家基金,行政人员要讨好上级,但又不懂又需要搞点事情反应自己的工作,不懂科研规律也从来没干过科研的行政人员从他们上中小学的小孩参加课外实习班提高了成绩就得到启发,找一些大牛给大家补习补习呗。补习班所请的大牛也许水平不错,但不同学科不同专业区别很大,决定了只能泛泛而谈。而且这种讲技巧的东西,听过一次就好,需要年年去听吗?说实话多数人讲的东西都是老生常谈,大家只要认真去看指南,讲的那点东西基本上都有了。不知道作用能有多大。

事实上因为提职称需要国家基金,做科研需要经费,根据不需要这种没有用处,还浪费时间的动员会,各位老师都会一如既往精心准备基金本子。如果哪年成绩不错,行政人员就将之归于自己的补习班有效,然后继续举办各种基金补习班,乐此不疲。

动员会、补习班一点用没有,但如果各位写基金的同志们能够找到资深同行,就写的本子给仔细诊断问题所在,针对问题补充改正,是可以极大提高质量。