This topic has been archived. It cannot be replied.
-
枫下家园 / 电脑电信 / 有什么软件可以具有自动建立文件数据库的功能,需要是把一个文件夹内存储的书籍文件的有关信息自动汇总成数据库,不需要人工输入?比如书籍(PDF or DOC 文件)的名称,出版社名,作者名,出版日期,第几版,书籍页数等信息自动收集出来形成EXEL 文件存到文件夹内,文件夹总的图书文件增减,这个统计文件也自动随着证件。希望熟悉数据库的IT 高手给个指导,有现成的软件做这个吗?
-liaison01(红桃A);
2020-7-13
{231}
(#13079860@0)
+1
-
自己写一个吧,简单的话半天时间足够了。
-guestagain(guest again);
2020-7-13
(#13079926@0)
+4
-
这个好像没那么简单。怎么将文件中的信息自动抽取出来才是关键,比如你给个EBOOK 书取个文件名叫A001,而实际的书名叫ABC,软件就要能自动吧文件内的属性信息抽出来才可以,比如说,书名,作者名,出版社名是不是可抽取的,还只有创建文件的人在文件内设置了这个属性,才可以。
-liaison01(红桃A);
2020-7-13
{161}
(#13080798@0)
-
你说的是原始数据的问题。程序本身很简单,就是监视文件夹的变化,然后读取,更新数据而已。
-guestagain(guest again);
2020-7-13
(#13080819@0)
-
如果是正式出版的书的话,可以用ISBN去查,有免费的API。或者直接从AMAZON上抓. ebook的话特别是偷出来的metadata很多不全
-gta_palace(呄 - 每天乃古);
2020-7-13
(#13080845@0)
-
这个可以读入PDF搞文本匹配,不过每个文件未必一致。程序的问题是如何处理那些异常部分,这就要调试修改,相当琐碎。所以一般大领导不学编程,雇秘书
-manniangpai(慢两拍);
2020-7-14
(#13082979@0)
-
用程序处理异常部分通常不划算,直接出个report,然后你手动处理还省事。
-guestagain(guest again);
2020-7-14
(#13083035@0)
-
有道理
-manniangpai(慢两拍);
2020-7-14
(#13083152@0)
-
如果有质高价廉经久耐用的,我合计只能是LD 了。
-troyd(Unfiltered);
2020-7-13
{7}
(#13079937@0)
-
我就是那个懒LD, 不能再求别人了。
-liaison01(红桃A);
2020-7-14
(#13082168@0)
-
不方便告诉你。你是小粉红吧?
-firetrain(火车头);
2020-7-13
(#13079978@0)
+5
-
我在技术问题上通常没政治倾向的。不管粉红和民豆,无一例外都是闲扯的。
-liaison01(红桃A);
2020-7-13
(#13080790@0)
+1
-
写个Perl script 来实现,应该不难! 估计1-200行代码 可以搞定了。
-boolean(北漂一族);
2020-7-14
(#13082855@0)
-
$20 买 200 行够不够?要是 160 行能解决,不用找了!
-troyd(Unfiltered);
2020-7-14
(#13082994@0)
-
软件行业的production 代码 $20块 200行代码? 好吧,如果照这个收费,微软估计早关门大吉了。😄
-boolean(北漂一族);
2020-7-15
(#13083931@0)
+1
-
如果是按行收费,我就写一个20K的
-thai68(仁义);
2020-7-15
(#13084333@0)
-
我的想法是开发一个应用,用它打开一个文件夹,把文件夹内的文件属性参数抽出来,生成一个 Excel or Access 的数据库文件,存到文件夹中,而且会根据其中文件删减,自动更新。
-liaison01(红桃A);
2020-7-14
(#13083360@0)
-
你目前就实现这么点功能,不用上什么app啥的。搞的那么fancy,一开始就是纯粹的实现功能就好了。就是开发个用命令行的小工具,先实现功能。以后如果需要其他的功能,慢慢添加就是了。软件开发不是一下子就捅到底的,大家都是迭代增加。
-boolean(北漂一族);
2020-7-15
(#13083933@0)
+1
-
谢谢!我试试看。
-liaison01(红桃A);
2020-7-15
(#13084977@0)
-
c# 10-20 行左右吧,當然要用到一些第三方分析.pdf文件的控件
-binghongcha76(一只大猫);
2020-7-14
(#13083659@0)
-
纯杠下,不可能perl比c#更多行吧。perl文本分析能力变态太多了吧。
-uno(无双);
2020-7-15
(#13083966@0)
-
楼主的需要的不是分析文本,就是把pdf文件根据它的属性分类(页数,作者等等)然后把分类结果存到一个.csv文件中,C# 20行不能再多了
-binghongcha76(一只大猫);
2020-7-15
(#13084274@0)
-
存储普通文本没意义,要建立全文索引就牛了,搜索快如闪电,
-googlebot(bot);
2020-7-14
(#13083225@0)
+1