Skann

Igår skannade jag förra terminens föreläsningsanteckningar, men denna gången använde jag mig av en lite bättre skanner, nämligen en Ricoh Aficio MP6500. Efter lite experimenterande kom jag fram till att den bästa inställningen för mig (som använder blyerts på randigt papper) var "Text", 300dpi och maximal "density" (mörkhet, 7/7).

Själva skanningen av de 221 dubbelsidorna tog mindre än en kvart.

De resulterande svartvita PDF-filerna körde jag genom Digitzones PDF to PNG converter, vilket också gick snabbt. Dock är det bara trialware, men jag hittar ingen information om vad för begränsningar det finns. Kanske kommer det någon dag att plötsligt sluta fungera.

Kommentarer
Tim [http://gurka.se/] (2011-04-17 @ 13:21:57):

Varför vill man lagra som PNG istället för PDF? Speciellt om scannern OCR:ade delar.



convert från ImageMagick gör pdf->png open source


Pelli [http://pelli.blogg.se/] (2011-04-17 @ 14:07:08):

Jag tror inte det blev någon OCR, och jag har svårt att tänka mig att skannern kan läsa min handstil. Hur bra är OCR-tekniken nuförtiden?



Jag föredrar PNG för att det går att öppna en specifik sida direkt och det är lätt att ändra fel med mspaint :p



Tack för tipset om ImageMagick!


Tim [http://gurka.se/] (2011-04-17 @ 15:08:18):

Jaha, handskrivet :p


Pelli [http://pelli.blogg.se/] (2011-04-17 @ 15:31:40):

Visserligen är uppfattningen att anteckningarna var datorskrivna förenlig med att jag behövde skanna in dem, eftersom originalfilerna kanske ligger på föreläsarens dator - ibland används ju termen "anteckningar" även om sådant som föreläsaren delar ut - men jag tror inte den är förenlig med att anteckningarna var i blyerts... :p


Tim [http://gurka.se/] (2011-04-17 @ 20:19:18):

Ok, jag läste inte tillräckligt noga!


Tim [http://gurka.se/] (2011-04-17 @ 20:20:23):

F.ö. har jag börjat svara "boobs" varje gång det kommer ett svårt ord i blogg.se:s captcha, och det har fungerat tre gånger sedan igår.


Tim [http://gurka.se] (2011-04-17 @ 20:20:44):

Fyra


Pelli [http://pelli.blogg.se/] (2011-04-17 @ 23:23:09):

Så i framtiden när någon bläddrar igenom något reCAPTCHA-"OCR":at arkivdokument kommer det dyka upp "boobs" överallt? :p



Kommentera inlägget här:
Namn: Kom ihåg mig?
Mail:(publiceras ej)
URL:
Kommentar: