in

大卫·谢泼德的GISMO

光学字符识别(ocr)的概念——也被称为将印刷文本图像转化为文本代码——在某种形式上已经存在了将近200年的时间。早在19世纪50年代,发明家们就开始向专利机构提出能够识别拉丁字母的机器的方案。然而,直到20世纪50年代——在蓬勃发展的计算机处理行业中——ocr技术才真正开始流行。这主要归功于一项发明:david shepard的gismo。

david hammond shepard在电视节目《我有个秘密》(1959年11月18日)中的画面

关于david shepard的三个事实

  • 除了他的gismo发明外,shepard还创造了如今大多数信用卡上看到的标志性的farrington b数字字体。
  • shepard的另一项发明是对话机,它是第一台使用早期语音识别技术提供交互式语音回应的设备。
  • shepard还致力于探索高空风力发电的可能性。

david shepard的gismo:历史

20世纪90年代的david hammond shepard。

1951年,美国发明家david shepard与合作者harvey cook jr.在他们的阁楼上建造了第一台光学字符识别(ocr)系统。这个发明被称为“gismo”,它能够将印刷信息转化为计算机语言进行处理。shepard和cook在1950年初开始研究这个计算机处理设备。在弗吉尼亚州阿灵顿的shepard家的阁楼上,两人花了近一年的时间(并投入了4000美元)进行这项发明的研究。

快速事实

创建时间
1951年
创造者
david shepard和harvey cook jr.
最初用途
阅读和处理打字文本
成本
不适用

1950年12月,shepard和cook终于完成了他们的光学字符识别设备。他们称之为gismo,这台计算机处理机器可以识别标准打字机产生的23个拉丁字母。经过又一年的工作(以及更多的财务投入),shepard和cook推出了一台改进的gismo,可以识别拉丁字母表的全部26个字母。

shepard于1951年3月1日提交了他的“用于阅读的装置”的专利申请。该专利直到1953年12月22日才被授予。重要的是它被授予了专利。该专利申请描述了gismo作为一种阅读装置,能够感知印刷字符和打孔开口,并识别传感器前特定字符或其他物品的身份。该申请还描述了这些物品将以各种形式的编码形式再现的过程。他们认为gismo有许多实际用途,比如扫描打印、打字的页面并产生将每个字符转化为任意所需编码形式的信号。

shepard的“阅读装置”的专利图纸(扫描手段的一般布置)

在1952年,shepard和他在武装部队安全局(armed forces security agency)的战时工作中的同事william lawless jr.合作商业化了这项发明。他们在弗吉尼亚州阿灵顿成立了智能机器研究公司(imr),以开发和销售gismo。他们的努力取得了成功:首批售出的12台机器被销售给美国电话电报公司(at&t)、第一国民城市银行、读者文摘和其他几家大型石油公司和银行。

在1953年,ibm获得了imr的专利许可。在1955年,他们与imr签订了一份合同,以开发一种名为scandex的开发系统,并以支付5%的版税为交换。scandex的发明是为了识别约束性手写数字字符。然而,ibm实际上从未推广过这个系统。在1959年,ibm代替推广了自己的系统。将其归类为光学字符识别(ocr)系统,从那时起,ocr一词成为了该行业对这种技术的标准术语。

在1959年,当时信用卡行业领先的公司farrington manufacturing co.以及imr的最佳客户收购了imr。这笔交易使imr成为farrington的子公司,shepard成为farrington的最大股东。这笔交易导致了shepard的数字字体farrington 7b成为当时大多数知名信用卡的标准字体。今天,这种字体仍然可以在几乎所有信用卡和借记卡的正面看到。

farrington 7b字体

david shepard的gismo:工作原理

在20世纪50年代中期,shepard致力于优化gismo的扫描过程,他发明了一种对机器更易读取的字体。在纽约华尔道夫酒店的一次鸡尾酒会上,shepard在餐巾纸上设计了这种字体。这是一种完美的字体,适用于20世纪中叶早期模拟卡片处理设备的更清晰传输。

gismo通过光电眼扫描拉丁字母,然后将其读取的内容记录在机械打孔机上。它会扫描每个字母并将其与内置记忆中的印象进行匹配。后来,shepard开发出了一种更准确的光学字符识别方法,使用了激光

shepard的conversation machine专利图纸

david shepard的gismo:历史意义

要理解gismo的历史意义,首先需要了解david shepard本人的历史意义。你知道,david shepard是一个富有创造力的发明家,拥有29项专利。许多专利似乎领先于他们所处时代几十年。

例如,在20世纪50年代,shepard试图向杂货店连锁企业推销他开发的一种条形码系统,告诉客户店内的每个物品都可以有一个可读取的条形码。他还说,最终,人们将拥有按键式电话来输入他们想要的商品的编号。根据shepard的说法,店员可以将商品装袋,并在店里等待顾客。店长们认为他只是另一个疯狂的发明家,并告诉他应该回家去。

cognitronics speechmaker

根据他的众多想法和发明的长而令人印象深刻的列表,不难理解shepard的gismo的历史意义。这个设备不仅在20世纪中叶彻底改变了数据输入的世界,而且它还成为现代认知计算、当代机器翻译和当代文本转语音的重要组成部分。ocr也可以被视为一种人工智能形式。可以说,如果没有shepard的gismo,我们就不会有这一切。

next up…

Written by 小竞 (编辑)

他们称呼我为小竞, 做作为河小马的助理有5年时间了,作为jingzhengli.com的编辑,我关注每天的科技新闻,帮你归纳一些现有科技以及AI产品来提升你的生产力,拥抱AI,让科技和AI为我们服务!