Lähdeaineistojen ja tekstien editointi
Analyyttisten menetelmien soveltamisessa yleinen ongelma
on ollut lähdetiedoston huono koneluettavuus.
Tiedoston tiedot ovat hyödyllisiä,
mutta tietojen tuonti tarkastusohjelmistoon ei onnistu.
Tällöin voidaan yrittää korjata tietojen esitystä tiedostossa [--1--].
Kun käytin yleisiä tarkastusohjelmistoja,
tein myös makroja, joilla muokkasin dataa sisältäviä tiedostoja kuntoon ohjelmistoihin tuotavaksi.
Kokosin seuraavat makrot TexEdi-makrosettiin [--2--]. Makrojen avulla voi ..
– tutkia tekstitiedostoa [merkkien määrä summattuna kussakin positiossa]
– muuttaa tiedoston tekstirivit samanpituisiksi [määrämittaisiksi]
– poistaa tekstitiedostosta tyhjät rivit [tuonnin mahdollistamiseksi]
– korvata tietyt merkit toisilla merkeillä tai poistaa ne [rivin annetulla positiovälillä]
– poistaa tekstitiedostosta rivinvaihdon [tekstin keräämiseksi kappaleisiin]
– liittää yhden tai useamman rivin edellisen rivin perään [kun systemaattinen virhe lähdetiedoston muodostamisessa]
– lisätä rivinvaihdon tekstitiedostoon [tietueiden erottamiseksi toisistaan]
– poistaa tuhaterottimen numeroista [laskennan helpottamiseksi]
– muuttaa tekstitiedoston kirjaimet isoiksi tai pieniksi [rivin annetulla positiovälillä].
Makrot eivät muuttaneet alkuperäistä lähdetiedostoa, vaan ne loivat uuden tiedoston.
Makrojen lähdekoodi oli yksinkertaista [--2--].
Omat kommentit
Kaikille makroille oli käyttöä.
Joitakin käytin muuhunkin kuin
tietokoneavusteisen tarkastuksen (CAATs) valmisteluun.
Niistä oli apua esimerkiksi, kun vein kappaleisiin rivit, jotka teknisesti olivat kappaleita itsessään [--3--].
Tein lisäksi muitakin tekstinkäsittely skriptejä,
esimerkiksi Turbo Pascal-ohjelman kotisivujen editointiin.
Editointia varten määrittelin luetteloon, mikä merkkijono korvataan milläkin merkkijonolla.
Ohjelmisto listasi hakemiston kotisivut
ja tutki yksi kerrallaan niiden HTML-koodin ja korvasi siinä olevat merkit tai merkkijonot uusilla merkeillä tai merkkijonoilla.
------
[--1--]
Tiedosto avataan ja sitä analysoidaan ongelmien tunnistamiseksi.
Ongelmien luonne ja laajuus arvioidaan.
Ongelmat poistetaan, jos ne ovat poistettavissa kohtuullisella työmäärällä.
[--2--]
Yleensä makrot antoivat käyttäjän valita editoitavan datatiedoston (lähdetiedosto).
Sitten makrot avasivat sen ja lukivat tiedostoa rivin kerrallaan,
käsittelivät ja muokkasivat lukemaansa, kirjoittivat muokatun rivin uuteen tiedostoon (kohdetiedosto)
ja lopuksi sulkivat lähde- ja kohdetiedostot.
[--3--]
Makron, jonka tuli viedä rivit kappaleisiin, piti osata tunnistaa,
mistä kappale alkaa, jotta rivit menevät oikein kappaleisiin.
Ratkaisu oli yksinkertainen ja toimi hyvin.
|