Šiame duomenų rinkinyje kaupiamos Lietuvos Respublikos Seimo posėdžių debatų stenogramos. Stenogramos parsiunčiamos automatizuotu būdu iš LR Seimo portalo ir/arba paieškos įrankių (abiejų sąrašų įrašai sutikrinami ir sudaromas bendras stenogramų sąrašas (su nuorodomis į šaltinius), kuris pridėtas prie šio duomenų rinkinio). Duomenų rinkinys apima stenogramas nuo 1990 m. kovo mėn. 10 d. iki paskutinės pilnos eilinės LR Seimo sesijos. Duomenų rinkinio atnaujinimas vykdomas pasibaigus paskutinei eilinei LR Seimo sesijai.
Stenogramos parsiunčiamos DOC/DOCX formatais ir transformuojamos į TXT bei CSV ir XLSX formatus:
1. Konvertavimas į TXT formatą vykdomas naudojant du įrankius: MultiDoc Converter (www.multidoc-converter.com/en/index.html) ir EmEditor (www.emeditor.com).
2. TXT formato stenogramos konvertuojamos į struktūruotus CSV ir XLSX failus naudojant R skriptus, kurie pridedami prie šio duomenų rinkinio.
3. Prie duomenų rinkinio pridėtas dokumentas, kuri aprašo CSV ir XLSX failų struktūrą.
Stenogramos surinktos ir sutvarkytos įgyvendinat projektą "Lietuvos Seimo politinė darbotvarkė ir jos įrėminimas: 1990-2020 m. Seimo stenogramų analizė", kuriam finansavimą skyrė Lietuvos mokslo taryba (LMTLT), sutarties Nr. P-MIP-20-373.
The transcripts were collected and processed implementing the project "Policy Agenda of the Lithuanian Seimas and its Framing: The Analysis of the Seimas Debates in 1990-2020", which has received funding from the Research Council of Lithuania (LMTLT), agreement Nr. P-MIP-20-373.
(2021-09-25)