Problems of Forensic Sciences 2016, vol. 105, 355–369

TesT audio recordings and Their use in auThenTiciTy examinaTions. daTabase of properTies of digiTal audio recorders and recordings

Marcin Michałek

Institute of Forensic Research, Kraków, Poland summary currently, there are many brands and models of devices with a digital audio recording function and with different recording pa- rameters. at present, experts almost exclusively receive digital devices and recordings stored using digital technology for foren- sic audio examination – these have almost entirely replaced analogue techniques in the field of multimedia. The aim of this study was to collect devices with a digital audio recording function, and then make test recordings with these devices and determine the possibility of converting them into a standard format. a database containing the parameters of the analysed recorders and their recordings was created as part of this study. The test recordings were made in available recording formats for each recorder and under different acoustic conditions. it was determined that the largest groups of analysed recorders was voice recorders (75%), followed by mobile phones (19%) and other devices with an audio recording function, such as multimedia players, tab- lets and cameras (6% in total). The test recordings were made in 18 different recording formats, which were characterized by different quality and parameters. The most numerous formats were: WaVe aDPcM, WMa and MP3. The conducted research and results, as well as the constructed database, are helpful for experts investigating the authenticity of audio recordings.

Key words authentic recording; Database; Digital recorder; Test recording.

Received 20 June 2016; accepted 29 September 2016

1. introduction digital recordings. Now, thanks to the prevalence of digital devices, expert reports concerning analysis of The technique of digital recording and editing analogue recordings are rare. expert practice indicates of data has been applied in particular to multimedia that evidentiary digital recordings are mostly made not documents (ho, Li, 2015; Savage, Vogel, 2014). cur- with high quality professional equipment, but rather rently, the prevalence and diversity of digital devic- with widely used consumer devices, such as those es with a recording capacity is increasing – not only mentioned above (Michałek, 2014). voice recorders and video cameras dedicated to this Due to the large number of brands and models of purpose, but also other generally used devices, such recorders, there are currently many audio recording as mobile phones, tablets, cameras, multimedia play- formats, which are distinguished by various parame- ers and various types of flash drives (memory sticks) ters (casey, Turnbull, 2011; ho, Li, 2015; Urbański, with a recording function (ho, Li, 2015; Michałek, 1989). in forensic audio analysis, the best solution is 2014). Just a few years ago, evidentiary analogue to import a recording into the working space of pro- recordings constituted the clear majority among ev- fessional programmes designed for listening to and identiary recordings, with just a small proportion of analysing recordings. Such programmes usually rec- 356 M. Michałek ognise many common recording formats. However, database constitutes a tool that can aid experts in the some producers, even well-known, use their own, of- authentication of digital audio recordings. ten non-standard, recording formats in their own re- corders, which require conversion to standard format for the purpose of importing them into analysing soft- 2. The significance and making of test ware. Therefore, it is important to have a programme recordings which will make such a conversion, for example into the form of uncompressed WaVe PcM. When carrying out an authentication of a record- The fact of acceptance of recordings as evidence ing, special attention should be paid to the stage linked material by a judicial body and also the range of re- with making test recordings. Could an evidential re- quested analyses results in the necessity of evaluat- cording have been tampered with? is it original? Was ing their authenticity (cooper, 2006; Grigoras, 2005; it recorded using a particular recorder? – these are hong, Yin, 2013; kajstura, Trawińska, hebenstreit, among the most frequent questions posed by judicial 2005; koenig, 1990; korycki, 2011; Michałek, 2009). bodies and related to forensic audio analysis. In order The definition of the authenticity of a recording given to answer them, it is necessary to carry out an analysis by the audio engineering Society (aeS) indicates the of the recording’s authenticity. necessity of establishing its continuity and originali- The evidential material collected in the case may ty and hence the method of recording (aeS, 1996). include – apart from the recording – the recorder The prevalence of equipment and software used for which is believed to have been used to make the re- digital editing of recordings has created broad possi- cording. if the judicial body has not provided the giv- bilities of interfering in their content (kirn, 2007; ko- en recording device, the expert should request that it rbecki, 1999; Sztekmiler, 2003). That is why currently be secured and submitted to him/her for examination. authentications of digital recordings require a combi- The recorder can be used to make test recordings and nation of various forensic audio methods, as well as carry out a comparative auditory analysis as well as the co-participation of tools from the field of forensic an analysis of the parameters and characteristics – and informatics. also of possible traces indicating discontinuity – in an important element in the process of authenti- relation to the evidential recording. In this way it is cating a digital recording is making test recordings possible to establish methods of copying recordings with the help of the device that is believed to have from and to the memory of the device in question. This been used to make the digital recording. These test re- stage of testing also allows you to establish whether cordings allow you to carry out a comparative analysis the analysed device is working properly and can re- of their parameters and file structure in relation to the cord. Before the expert starts to study the recorder and evidentiary recording. They also enable you to verify make test recordings, its current settings must be ver- whether the recorder is working correctly, to study its ified – including the date and time – and data must properties and to establish whether it could really have be secured from the memory by making copies of its been used to make the evidentiary recording (cooper, contents. This enables a comparison of the content of 2006; hong, Yin, 2013; koenig, Lacey, 2012). the memory of the recorder after finishing the analysis Digital recorders that are currently generally avail- with the state before beginning analysis. If the device able enable you to choose recording parameters, result- allows it the expert should make a so-called memo- ing in recordings of varying quality. The wide variety ry image as well as calculate checksums, for example of brands and models of these devices and of the for- with an MD5 algorithm, both for the physical area of mats of recordings has compelled us to undertake re- the imaged memory of the device, and – for the pur- search in this field. in this paper, the process of making pose of verification – for its image. This is aimed at test audio recordings and analysing their parameters securing the memory of the data carrier in the state in has been described. The test recordings were made us- which it was submitted for analysis, which has great ing the collected recording devices, making use of the significance for results and conclusions drawn on this range of available settings and recording functions. On basis (Breeuwsma, De Jongh, klaver, Van Der knijff, this basis, a database has been constructed containing Roeloffs, 2007; casey, 2010). information about the studied recording devices and Before making test recordings, it is necessary to the recorded test recordings, together with access to carry out a thorough auditory analysis as well as an original audio files. The database also contains a list analysis of parameters and characteristics of the evi- of programmes enabling conversion of recordings to dential recording for the purpose of establishing what the standard format – WaVe PcM. The constructed sounds were recorded and in what acoustic conditions.

Problems of Forensic Sciences 2016, vol. 105, 355–369 Test audio recordings and their use in authenticity examinations. Database of properties of digital audio recorders and... 357

The expert should also familiarize with the recording ta, which describe relevant data with encoded sound possibilities, the functions of the recording device (Gloe, Fisher, kirchner, 2014; hong, Yin, 2013; koe- and the power supply options, by analysing the op- nig, Lacey, 2012). Such an analysis is carried out using erating manual and the available menu as well as by software enabling visualisation and editing of files in assessing the technical state. This will enable you to the form of hexadecimal code. draw up a plan for making test recordings, containing Metadata in audio files contain information that is a description of their execution, the sequence of re- significant for authentication investigations. in- par cordings and the sequence of played back sounds as ticular, the format of a recording and the parameters well as the applied parameters and functions. a plan of a multi-media file can be found within the so-called is necessary both for carrying out and archiving these header, situated at the beginning of a block of data. activities and for later analysis of recordings. A good, additionally, the following can be saved in the header: tried and tested practice in the course of making each the date and time of the recording, the duration of the of the test recording is to create a written description: recording, the brand and model of the device, the size the date and time of the beginning and the end of the of the file and the size of the part containing the en- recording, the place of recording and current acoustic coded sound. Metadata are also stored within so-called conditions, the brand and model of the device, power tags, for example in iD3 tags applied in the popular supply, parameters of the recording and applied func- MP3 audio file format. as a result of editing an audio tions as well as successively recorded signals. file using programmes designed for this purpose, very In the course of making test recordings in acous- often entries arise in the file structure, for example in tically isolated rooms, signals of previously defined XML or XMP format. Such additional metadata, as duration and frequency ranges, such as basic tones practice shows, are usually saved in the end part of and noises are generated, and speech and intention- the data structure of the edited file. it should be added al interferences are also recorded. if it is significant that currently many different audio formats exist and for the results of analyses and possible to carry out, each of them usually has a different structure. Making the test recordings should be made in the place where test recordings creates an opportunity for comparative the event was recorded or in acoustic conditions that analysis of the data structure of the test recordings are similar to them and contain sounds corresponding with the structure of the evidential file. to those from the analysed recording. Test recordings It might seem that making test recordings is rela- should be made using the available functions and re- tively simple – consisting basically in switching on the cording parameters of the given device; additionally, recording function, recording the desired sounds, and recordings should be repeated several times for each then turning off the recording function – in comparison setting, for the purpose of mutual verification. This to other forensic audio analyses. However, contrary to will allow complete analysis of time and frequency appearances, it is a complicated and time-consuming characteristics of these recordings as well as possible task. The expert needs to carry out a detailed analy- characteristic traces that have arisen as a result of us- sis of the evidentiary recording and preliminarily pre- ing the pause function, automatic stopping of the re- pares the recording device and planned actions as well cording or editing, which cause interruptions in the as makes the recordings in accordance with a planned continuity of the recording. Test recordings allow you schedule, copy them, and later carry out a laborious to determine whether the device enables recording of comparative analysis in relation to – sometimes nu- the hum signal, and to reveal other possible charac- merous – evidentiary recordings. teristic features, such as generation of signals of con- Digital audio recorders – which are affordable and stant or variable time-frequency parameters and the easy-to-use nowadays – offer the possibility of chang- Dc offset (cooper, 2006; Grigoras, cooper, Michałek, ing the quality of a recording, although they often have 2009; kajstura, Trawińska, hebenstreit, 2005; kory- manufacturer’s pre-defined settings. More advanced cki, 2011; Michałek, 2009). if the DTMF signal – as recorders enable a change in such parameters, for ex- well as interferences resulting from mobile phone use ample: number of channels, sampling rate, bit reso- and other signals that have standard time and frequen- lution, recording in compressed or uncompressed for- cy parameters – have been recorded on the evidentiary mat, and audio format. In addition, they have a built- recording, then these parameters can also be recorded in clock which can be set, are equipped with a pause on test recordings in order to verify them. function or voice-activated recording, noise filtering, analysis of the structure of audio files is also car- and they even enable editing of recordings by remov- ried out as part of authenticity investigations of dig- ing fragments or combining them. The above results ital recordings. Such files contain so-called metada- in a large number of possible combinations of settings

Problems of Forensic Sciences 2016, vol. 105, 355–369 358 M. Michałek during recording, which is reflected in the number of After saving in the memory of the recorder, each of test recordings. Table 1 presents parameters and func- the test recordings was copied onto the hard disk of the tions that can be changed in two typical generally laboratory computer for further analysis or an image available audio recorders, and the resultant number of was made of the content of the memory of the device. combinations of recording settings for double repeti- Test recordings were made using all possible re- tion of each setting. additional functions or parame- cording settings of the studied devices as well as ters increase the number of combinations of settings. available functions such as start and stop of recording, pause function, voice-activated recording, indexing, Table 1 filtering background noise, as well as possible editing Settable parameters and functions and the number of of recordings. Test recordings were made in various their combinations for two different audio recorders acoustic conditions, recording the broadest possible range of sounds. In acoustically isolated rooms, using Recording parameters Recorder 1 Recorder 2 a computer work station equipped with monitor speak- and functions ers and headphones, the following were generated and Audio format WaVe MP3 WMa recorded: wide-frequency noise, tones in low, medium aDPcM and high frequency ranges, pulsed and continuous in- Number of quality 2 2 6 terference, and speech. Using the examined recorders, settings sounds in open space associated with street traffic were Continuous recording Yes Yes also recorded as well as sounds inside moving vehi- Pause function None Manual and cles. Speech at constant and changing distances from automatic the microphones of the recording devices were also Number of combinations 2 6 18 recorded in the acoustic conditions described above. of settings Number of recordings with double repetition 4 12 36 of each setting 4. Analysis of the properties of the tested devices and test recordings

Conducting test recordings enabled analysis of the 3. research material properties of the studied devices. as mentioned, as part of the research, nearly 120 devices with a digital 3.1. Digital recorders audio recording function were collected and analysed. Table 2 presents the results of analysis of the proper- in order to perform the research, nearly 120 com- ties of the devices used to make the test recordings. monly available devices with a digital audio record- The table contains the following information: the ing function, such as voice recorders, mobile phones, brands of the collected recorders, their types, numbers multi-media players with a recording function, tablets of formats, capability of changing the quality of re- and video cameras were collected and analysed. The cording for available formats and saving of audio files following brands of devices were studied in the pres- as uncompressed or compressed files. ent research: apple, BlackBerry, creative, hTc, JVc, Using the collected recording devices, test record- LG, Marantz, Nokia, Olympus, Panasonic, Penta- ings were made in 18 different recording formats, gram, Philips, Roland, Samsung, Siemens, , Tas- i.e.,: 3GP, aiFF, aMR, BWF, DSS, M4a, MP2, MP3, cam, , Track and Zoom. Test recordings were MOD, OMa, OMG, PVc, WaVe aDPcM, WaVe saved on internal and removable memories, both flash PcM, VM1, VY2 (VY4), VYF and WMa. Table 3 and MiniDisc. shows the percentage share of the most frequently oc- Before making the test recordings, the operating curring formats in relation to the general number of manual, recording capabilities and technical state was recordings. studied carefully and the photographic documentation The performed analysis showed that a significant was made for every device. majority of test recordings were conducted using dig- ital voice recorders and in three dominant recording 3.2. Digital sound recordings formats, i.e., WaVe aDPcM, WMa and MP3. Most of the studied devices recorded in only one file format, Using the collected devices, over 720 digital audio but a considerable number of them allowed a choice recordings were saved in 18 different audio formats. between two or even three different formats. in the

Problems of Forensic Sciences 2016, vol. 105, 355–369 Test audio recordings and their use in authenticity examinations. Database of properties of digital audio recorders and... 359

Table 2 Properties of digital devices used to make audio test recordings

Olympus Sony Nokia, Tascam, Samsung Others Brand (58%) (8%) (each 5%) (19%) Voice recorder Mobile phone Multimedia player Tablet, video camera Type (75%) (19%) (3%) (3%) Number of audio One Two Three More than three formats (59%) (25%) (15%) (1%) Yes No Quality setting (87%) (23%) Uncompressed and compressed audio files Only compressed audio files compression (32%) (68%)

Table 3 The proportion of most frequent audio file formats (as a percentage of all test recordings)

Audio format WaVe aDPcM WMa MP3 AMR WaVe PcM 3GP M4a Others Proportion [%] 42 26 10 7 5 3 2 5 event of a recorder being able to record in more than all the tested recorders allow to copy files contain- two formats, the most frequently encountered were: ing recordings onto the hard disk of a computer using WMa and MP3 (using compression) and WaVe PcM a digital connector. Some of them, especially older (uncompressed). individual devices amongst those an- models, only allow to transfer files containing record- alysed enabled recording in more than three formats – ings using dedicated manufacturer’s software installed these devices were mainly technically advanced audio in the of the computer. For example, recorders. an example of such a device is the Marantz Olympus voice recorders and models in the VN series PMD671, which lets you record audio in four differ- use Digital Wave Player, whilst Sony recorders, when ent formats, including two uncompressed ones, i.e., saving on removable media carriers such as MiniDisc, WaVe PcM and BWF. From the conducted analysis for example model MZ-Nh900, require installation it also transpires that most of the studied devices al- of SonicStage. The other recorders allow to directly low you to choose the recording quality and change copy files from their memory onto a hard disk for the parameters for a specific format. This group mainly in- purpose of further analysis. On this basis, it was estab- cludes voice recorders with recording in WMa, MP3 lished that each of the studied recorders automatically and WaVe PcM formats. in turn, devices recording gave names to audio files (containing recordings) ac- in aMR format, i.e., mainly cellular phones, as well cording to an established scheme. example names of as certain voice recorders and media players with a re- sound files for specific device models are presented cording function in the WaVe aDPcM format, do below. The names of these files indicate: not allow to change recording parameters and thus to – the recorder model and the successive number of choose quality. the recording, for example: DS500001.WMa, it was established that the parameters of all con- WS650001.MP3 or 801_0182.MP3 (Olympus ducted test recordings lay within the following ranges: models: DS-50, WS-650S, and WS-801 respec- resolution 4–24 bits per sample, sampling rate 8–96 tively), DR-100_0001.WaV (Tascam DR-100), and khz, bit rate 5–2304 kbps and frequency band range R09_0001.WaV (Roland eDiROL R-09); approximately 3.8–40 khz. Low values correspond – transfer using dedicated software, labelling the fold- to recordings of low quality with a narrow frequen- er of the saved recording in the memory of the de- cy band, recorded with the help of algorithms char- vice and the recording number: DW_a0001.WaV acterised by strong compression. in turn, high values (Digital Wave Player software, folder a; this nam- are characteristic of recordings of high quality with ing system is used in the case of Olympus recorders a broad frequency band, recorded mainly in WaVe and models such as VN-120Pc, VN-1100Pc, VN- PcM uncompressed format. 2000Pc, VN-2100Pc and VN-3100Pc);

Problems of Forensic Sciences 2016, vol. 105, 355–369 360 M. Michałek

– date or date and time of recording: VN- Figure 2 shows two fragments of data structure of 20160216-00001.amr (BlackBerry 9320), re- an audio file recorded using an Olympus WS-650S cording-20130809-121814.MP3 (Pentagram Tab recorder in the second most common format among 7.5), 001-2009-10-08 11_49_40.oma (Sony MZ- test recordings, i.e., WMa. The first part of the struc- Nh900); the part of the file name indicating the ture (Fig 2a) contains metadata indicating the brand time depends on the built-in clock settings in the of the recorder (Olympus), model (WS650S), date device; and time of the beginning and end of the recording – number of the recording: 1001.WaV (Marantz (2010.01.04, from 16:50:58 to 17:43:57) and record- PMD671); ing time (00:52:59). in turn, in the second part (Fig- – the following names have also been noted: au- ure 2b), the parameters of the recording are indicated, dio, Głos, Mic, MOB, Nagr, Nagranie, Plik audio, i.e., format (WMa), bit rate (32 kbps), sampling rate Rec, Sound clip, Voice or VOc together with the (44 khz) and the number of channels (1). successive recording number in the memory of the Programmes for automatic analysis of multimedia device; such names of audio files are characteris- files sometimes only give some parameters of the re- tic, above all, for cellular phones and media players cording, or sometimes these values may be inaccurate; with a recording function. it may also happen that they do not recognise a giv- audio files containing test recordings in each ana- en format at all. Then the main source of information lysed recording format possess metadata – of greater about such a file is analysis of its data structure using or lesser extensiveness – concerning: the brand and a hex editor, which has been briefly described above. model of the recorder, the recording properties, the date, time and duration of the recording or amount of data in the file. as noted above, important information 5. Database of properties of digital sound is also included in the names of the saved files. recorders and recordings as well as in Figure 1, a fragment of data structure in an au- possibilities of their conversion to dio file in the WaVe aDPcM format – the type of WAVE PCM format format noted most frequently among test recordings – has been visualised in the form of hexadecimal (on the as part of the work carried out, all recorders used left) and aScii code (on the right). The region of the for making test recordings were systematically cat- file header which contains metadata with entries in- alogued. The following information is stored in the dicating the number of data in the file (00 10 8e 34 main catalogue for each recorder: information relating bytes in hexadecimal notation, in little-endian order), to technical and photographic documentation, soft- format (WaVe aDPcM, codec iMa, code 00 11), ba- ware for conversion from source format to standard sic parameters of the recording (1 channel, sampling and uncompressed WaVe PcM format, as well as the rate 22 050 hz, bit rate 88.8 kbps, resolution 4 bits test recordings themselves in source format and con- per sample) and number of data with encoded audio verted to WaVe PcM format. (00 10 8e 00 bytes) has been marked in the figure. The collection of catalogued and structured in- audio files recorded by Olympus recorders are formation constituted the basis for constructing a re- particularly noteworthy, containing easy to decode en- lational database in Microsoft Access together with tries indicating the brand and model of the device, the a user interface. This database contains the following date and the time of the beginning and end of the re- information for each studied device: the type of de- cording, the duration of the recording and its number, vice, a description of the make and model, documenta- and the parameters of the audio recording. Such data tion, the of type of recording (audio or video), a list of are recorded by most Olympus models. available audio file recording formats and extensions,

Fig. 1. The file header of a recording stored in WaVe aDPcM audio file format.

Problems of Forensic Sciences 2016, vol. 105, 355–369 Test audio recordings and their use in authenticity examinations. Database of properties of digital audio recorders and... 361

a)

b) Fig. 2. information and parameters of a recording stored in WMa audio file format by Olympus recorder.

Fig. 3. View of the main table of the constructed database containing information about analysed recorders and test recordings. a description of basic recording parameters, access icant amount of time. having a database with an open to the catalogue with files in source formats and con- structure enables to update it with further information verted formats as well as to the catalogue with pro- and recordings. grammes for conversion of recordings to WaVe PcM it is usually possible to play back a recording using format. A fragment of the view of the main table of the the device on which it was recorded; however, in the created database is presented in Figure 3. course of forensic audio analysis, professional com- inputting audio files containing recordings in their puter software serving to play and analyse recordings source format into the database enables to perform is used. Sometimes the material collected for analysis a comparative analysis of parameters between record- does not include the device on which the recording in ings made using the same models of a given brand question was made. Therefore it was analysed the pos- (make) and also between analysed evidentiary record- sibility of playing back saved test recordings in their ings. Collecting together structured data about digi- source formats and converting to standard and un- tal sound recorders and about parameters of their re- compressed format, i.e., WaVe PcM, using computer cordings and programmes for conversion in one place programmes. Playing back in the source format often enables quick access to significant information when gives you the possibility of preliminarily assessing the carrying out forensic audio analysis and saves a signif- recording and establishing the recorded content. In

Problems of Forensic Sciences 2016, vol. 105, 355–369 362 M. Michałek turn, conversion to WaVe PcM format allows you to devices with a sound recording function and the pa- import the recording into the working space of pro- rameters of test recordings made on them, as well as fessional programmes for the purpose of performing a database constructed on this basis. The structured auditory analysis and making a transcription, analys- collection of data enables to quickly verify the param- ing time and frequency characteristics in the course eters of a specific model of a recorder and its record- of authenticity analyses, as well as parameters of the ings, as well as determine the necessary software for speech signal during speaker identification studies. conversion from source format to PcM WaVe, which currently popular recording formats, such as enables further analysis of recordings. The open struc- WaVe PcM and aDMcP, MPeG-1 and MPeG-2 ture of the constructed collection allows you to update audio Layer iii (MP3), WMa, 3GP or aMR are well- it and supplement it with new data as you analyse suc- known and documented (3GPP, 2010; 3GPP, 2011; cessive recording devices. iSO/iec, 1992; Microsoft corp., 1994, Microsoft The results of the performed analyses and the men- corp., 2010). Many useful tools allowing their anal- tioned database are used in current expert witnessing ysis and playback, and conversion to uncompressed practice as aids in the authentication of recordings. it WaVe PcM are available. however, some producers should be added that the created collection of informa- of digital audio recorders use their own, non-standard tion on digital recording devices and their recordings recording formats accompanied by very poor docu- can certainly be helpful in investigations not only in mentation or even no generally available documenta- the field of audio forensics, but also in related fields, tion. Playing back such a recording and converting it for example, forensic informatics. The database also to the WaVe PcM format for the purpose of analysis provides adequate material for carrying out other anal- in appropriate software is thus problematic. it may yses of audio recordings. also turn out that analysis of the data structure of files containing such recordings and decoding of metadata is only possible to a limited extent. Acknowledgements among free programmes which enable to play The research work described in this article was carried back or convert most standard formats of recording out under research project no. X/k at the institute of Fo- to WaVe PcM, the following can be distinguished: rensic Research in kraków. Pazera Free audio extractor, operated from the com- mand-line and ffplay, Mobile Media convert- er and VLc media player. During the study, adobe References audition professional software was also used. The mentioned programmes enabled conversion of test re- 1. 3rd Generation Partnership Project (3GPP). (2010). 3GPP cordings from the following formats: WaVe aDPcM, TS 26.244 V 9.2.0: Technical Specification Group Ser- WMa, aMR, MP3, MP2, 3GP, M4a, aiFF, MOD vices and System Aspects; Transparent end-to-end pack- and BWF to the uncompressed WaVe PcM format. et switched streaming service (PSS); 3GPP file format For test recordings saved in less popular formats, (3GP) (Release 9). (Website) http://www.3gpp.org it was essential to use dedicated software by the man- 2. 3rd Generation Partnership Project (3GPP). (2011). 3GPP ufacturer of the given recorder to play them back and TS 26.090 V 10.1.0: Technical Specification Group Ser- convert them to WaVe PcM format. The collected test vices and System Aspects; Mandatory Speech Codec recordings in sound files with the extensions: VM1, speech processing functions; Adaptive Multi-Rate (AMR) speech codec; Transcoding functions (Release 10). PVc, DSS, VY2 (VY4), and VYF as well as OMa (Website) http://www.3gpp.org and OMG can be played back and converted using 3. audio engineering Society (aeS). (1996). AES rec- software, respectively: Voice editing, Voice editing ommended practice for forensic purposes – Managing Mini Player and Voice editing, DSS Player Lite and recorded audio materials intended for examination, DSS Player v.7, Voice yepp Player and WaV_con- AES27–1996. audio engineering Society inc. (Website) verter, Samsung Voice Manager and SonicStage. http://www.aes.org 4. Breeuwsma, M., De Jongh, M., klaver, c., Van Der knijff, R., Roeloffs, M. (2007). Forensic data recovery 6. summary from flash memory.Small Scale Digital Device Forensics Journal. (Website) http://www.mislan.com/SSDDFJ/ The paper describes the significance and use of 5. casey, e. (2010). Handbook of digital forensics and in- audio test recordings in the authentication of eviden- vestigation. Burlington, San Diego, London: elsevier tial recordings. it has been presented the properties of academic Press.

Problems of Forensic Sciences 2016, vol. 105, 355–369 Test audio recordings and their use in authenticity examinations. Database of properties of digital audio recorders and... 363

6. casey, e., Turnbull, B. (2011). Digital evidence on mo- 22. Michałek, M. (2014). Database and parameters of digi- bile devices. (in) e. casey (ed.), Digital evidence and tal audio test recordings. Paper presented at 16th eNFSi computer crime (pp. 603–606). Baltimore: elsevier aca- Forensic Speech and audio analysis Working Group demic Press. Meeting, Wiesbaden, Germany. 7. cooper, a. J. (2006). Detection of copies of digital audio 23. Michałek, M. (2009). The application of powerline hum recordings for forensic purposes. (PhD Thesis). Faculty in digital recording authenticity analysis. Problems of of Technology, Department of information and commu- Forensic Sciences, 80, 355–364. nication Technology, The Open University. 24. Savage, T. M., Vogel, k. e. (2014). An introduction to 8. Gloe, T., Fisher, a., kirchner, M. (2014). Forensic analy- digital multimedia. Burlington: Jones and Barlett Learn- sis of video file formats.Digital Investigation, 11, 68–76. ing. 9. Grigoras, c. (2005). Digital audio recording analysis: 25. Sztekmiler, k. (2003). Podstawy nagłośnienia i realizac- The electric network frequency (eNF) criterion. Inter- ji nagrań. Podręcznik dla akustyków. Warszawa: Naro- national Journal of Speech, Language and the Law, 12, dowe centrum kultury. 64–76. 10. Grigoras, c., cooper, a., Michałek, M. (2009). ENFSI Forensic Speech and Audio Analysis Working Group – Best practice guidelines for ENF analysis in forensic au- thentication of digital evidence, ReF. cODe: FSaaWG- BPM-eNF-001. eNFSi FSaaWG. (Website) www. enfsi.eu. 11. h o, a. T. S., Li, S. (2015). Handbook of digital forensics of multimedia data and devices. chicago: John Wiley & Sons. 12. h ong, G., Yin, Z. (2013). Research on digital audio au- thenticity analysis. 2nd International Conference on Com- puter Science and electronics engineering (iccSee 2013), hangzhou, People’s Republic of china. 13. i nternational Organization for Standardization and international electrotechnical commission (1993). ISO/IEC 11172-3: Coding of moving pictures and as- sociated audio for digital storage media at up to about 1,5 Mbit/s – Part 3: Audio. (Website) www.iso.org. 14. k ajstura, M., Trawińska, a., hebenstreit, J. (2005). ap- plication of the electrical network frequency (eNF) cri- terion. A case of a digital recording. Forensic Science International, 155, 165–171. 15. k irn, P. (2007). Real world digital audio. Edycja polska. Gliwice: Wydawnictwo helion. 16. k oenig, B. e. (1990). authentication of forensic audio recordings. Journal of Audio Engineering Society, 38, 3–33. 17. k oenig, B. e., Lacey. D. S. (2012). authenticity analy- ses of the header data encoded WMa files from small Olympus audio recorders. Journal of Audio Engineering Society, 60, 255–265. 18. k orbecki, M. (1999). Komputerowe przetwarzanie dźwięku. Warszawa: Wydawnictwo MikOM. 19. k orycki, R. (2011). analiza autentyczności cyfrowych nagrań fonicznych. Problemy Kryminalistyki, 271, 5–21. 20. Microsoft corporation (1994). Microsoft multimedia standards update, New multimedia data types and data Corresponding author techniques, Revision 3.0. Dr inż. Marcin Michałek 21. Microsoft corporation (2010). Advanced Systems For- instytut ekspertyz Sądowych mat (ASF) specification, Revision 01.20.05. ul. Westerplatte 9 PL 31-033 kraków e-mail: [email protected]

Problems of Forensic Sciences 2016, vol. 105, 355–369 Problems of Forensic Sciences 2016, vol. 105, 355–369

DźWiękoWE nAgRAniA TEsToWE oRAZ iCh WykoRZysTAniE W bADAniACh AuTEnTyCZnośCi. bAZA DAnyCh WłAśCiWośCi CyfRoWyCh REjEsTRAToRóW DźWięku i nAgRAń

1. Wstęp metody rejestracji (aeS, 1996). Powszechność sprzętu i oprogramowań służących do cyfrowej edycji nagrań Technika cyfrowego zapisu i edycji danych znalazła stwarza szerokie możliwości ingerencji w ich treść (kirn, zastosowanie w szczególności dla dokumentów multi- 2007; korbecki, 1999; Sztekmiler, 2003). Dlatego obec- medialnych (ho, Li, 2015; Savage, Vogel, 2014). aktual- nie badania autentyczności nagrań cyfrowych wymagają nie zaobserwować można coraz większą powszechność konkatenacji różnych metod fonoskopijnych, jak również i różnorodność cyfrowych urządzeń rejestrujących na- współudziału narzędzi z zakresu informatyki sądowej. grania, nie tylko w postaci dedykowanych do tego celu istotnym elementem w procesie badań autentycz- dyktafonów i kamer wideo, ale także innych urządzeń ności cyfrowego nagrania dowodowego są nagrania te- powszechnego użytku, takich jak telefony komórkowe, stowe wykonywane za pomocą urządzenia, które miało tablety, aparaty fotograficzne, odtwarzacze multime- służyć do jego rejestracji. Pozwalają one na przeprowa- dialne oraz różnego rodzaju pamięci przenośne z funk- dzenie analizy porównawczej ich parametrów i struktu- cją nagrywania (ho, Li, 2015; Michałek, 2014). Jeszcze ry plików względem zapisu z nagraniem dowodowym. kilka lat temu dowodowe nagrania analogowe stanowiły Umożliwiają także zweryfikowanie poprawności działa- zdecydowaną większość przy niewielkim udziale nagrań nia rejestratora, zbadanie jego właściwości oraz ustale- cyfrowych. Obecnie, dzięki powszechności urządzeń cy- nie, czy rzeczywiście mógł on być użyty do utrwalenia frowych, to ekspertyzy, w których analizowane są nagra- dowodowego nagrania (cooper, 2006; hong, Yin, 2013; nia analogowe stanowią nieliczne przypadki. Doświad- koenig, Lacey, 2012). czenie eksperckie wskazuje, że dowodowe nagrania Dostępne obecnie cyfrowe rejestratory umożliwiają cyfrowe w większości utrwalane są nie za pomocą wyso- wybór parametrów zapisu nagrań, co skutkuje ich re- kiej jakości profesjonalnych rejestratorów, ale urządzeń jestracją w różnej jakości. Spora różnorodność marek powszechnego użytku, takich jak wymienione powyżej i modeli tych urządzeń oraz stosowanych formatów (Michałek, 2014). zapisu wymusza podjęcie badań w tym kierunku. W ni- W związku z dużą liczbą marek i modeli rejestrato- niejszej pracy opisano proces rejestracji dźwiękowych rów istnieje obecnie wiele formatów zapisu dźwięku, nagrań testowych oraz analizę ich parametrów. Zosta- które odznaczaja się różnymi parametrami (casey, Tur- ły one utrwalone za pomocą zgromadzonych urządzeń nbull, 2011; ho, Li, 2015; Urbański, 1989). W badaniach z możliwością rejestracji nagrań oraz z wykorzystaniem fonoskopijnych najlepszym rozwiązaniem jest import na- dostępnych ustawień i funkcji zapisu. Na tej podstawie grania do przestrzeni roboczej profesjonalnego oprogra- skonstruowano bazę zawierającą informacje o zbada- mowania przeznaczonego do odsłuchu i analizy nagrań. nych urządzeniach i wykonanych nagraniach testowych Programy takie rozpoznają zwykle wiele powszechnych wraz z dostępem do oryginalnych plików dźwiękowych. formatów zapisu. Jednakże część producentów, nawet Zawarto w niej również wykaz programów umożliwia- tych dobrze znanych, stosuje w swoich rejestratorach jących konwersję nagrań do formatu standardowego własne i często niestandardowe formaty zapisu nagrań, WaVe PcM. Skonstruowana baza danych stanowi na- które wymagają konwersji do formatu standardowego rzędzie wspomagające eksperta w trakcie badań auten- w celu ich importu do oprogramowania analizującego. tyczności cyfrowych nagrań dźwiękowych. Należy przy tym dysponować programem, który dokona takiej konwersji, na przykład do postaci nieskompreso- wanej WaVe PcM. 2. Znaczenie nagrań testowych i ich realizacja Fakt akceptacji przez organa procesowe nagrań jako materiału dowodowego, jak również zakres badań wska- Wykonując badania autentyczności nagrania, należy zywanych przez zleceniodawców, skutkuje konieczno- zwrócić szczególną uwagę na etap związany z realiza- ścią analizy ich autentyczności (cooper, 2006; Grigoras, cją nagrań testowych. Wypowiedzenie się odnośnie do 2005; hong, Yin, 2013; kajstura, Trawińska, hebenstre- tego, czy dowodowe nagranie mogło zostać poddane ma- it, 2005; koenig, 1990; korycki, 2011; Michałek, 2009). nipulacji, jest oryginalne i zostało utrwalone za pomocą Podana przez audio engineering Society (aeS) definicja konkretnego rejestratora, to jedne z najczęstszych pytań autentyczności nagrania wskazuje na konieczność usta- organów zlecających badania fonoskopijne. aby na nie lenia jego ciągłości oraz oryginalności i związanej z tym Dźwiękowe nagrania testowe oraz ich wykorzystanie w badaniach autentyczności. Baza danych właściwości cyfrowych... 365 odpowiedzieć, konieczne jest wykonanie analizy jego gnały o określonym uprzednio czasie trwania i zakresach autentyczności. częstotliwościowych, takich jak tony podstawowe i szu- Zgromadzony w sprawie materiał dowodowy, oprócz my, utrwalana jest również mowa oraz celowe zakłóce- nagrania, może zawierać także rejestrator, który miał nia. Jeśli jest to istotne dla wyników badań i możliwe być wykorzystany do wykonania zapisu. Jeżeli zlecenio- do realizacji, nagrania testowe powinny zostać utrwa- dawca nie przekazał takiego urządzenia, należy zwrócić lone w miejscu rejestracji zdarzenia lub w warunkach się do niego z prośbą o zabezpieczenie i przekazanie akustycznych do nich zbliżonych i zawierać dźwięki go biegłemu do badań. Za pomocą takiego rejestratora odpowiadające tym z analizowanego nagrania. Nagrania możliwe jest wykonanie nagrań testowych i przeprowa- testowe należy utrwalać z wykorzystaniem dostępnych dzenie porównawczej analizy: audytywnej, parametrów, funkcji i parametrów rejestracji danego urządzenia; do- jak również charakterystyk wraz z ewentualnymi ślada- datkowo, w celu wzajemnej weryfikacji, z kilkukrotnym mi wskazującymi na braki ciągłości zapisu względem powtórzeniem dla każdego ustawienia. Umożliwi to peł- nagrania dowodowego. Możliwe jest przy tym ustalenie ną analizę charakterystyk czasowych i częstotliwościo- metod kopiowania nagrań z i do pamięci przedmioto- wych tych nagrań oraz ewentualne charakterystyczne wego urządzenia. Ten etap badań pozwala również na ślady powstałe w wyniku użycia funkcji pauzy, auto- ustalenie, czy analizowane urządzenie jest sprawne tech- matycznego wstrzymywania nagrywania lub montażu, nicznie i umożliwia utrwalanie nagrań. Przed rozpoczę- które powodują braki ciągłości zapisu. Nagrania testowe ciem badań rejestratora i wykonaniem nagrań testowych pozwalają ustalić, czy urządzenie umożliwia rejestrację weryfikuje się jego aktualne ustawienia, w tym także przydźwięku sieciowego oraz ujawnić ewentualne inne wskazania czasu zegara, oraz zabezpiecza dane z pamię- charakterystyczne cechy, takie jak generowanie sygna- ci poprzez wykonanie kopii jej zawartości. Umożliwia łów o stałych lub zmiennych parametrach czasowo-czę- to porównanie zawartości pamięci rejestratora po zakoń- stotliwościowych i składowej stałej (cooper, 2006; Gri- czeniu badań w odniesieniu do stanu sprzed rozpoczęcia goras, cooper, Michałek, 2009; kajstura, Trawińska, he- analizy. Jeżeli urządzenie na to pozwala, wykonuje się benstreit, 2005; korycki, 2011; Michałek, 2009). Jeżeli tzw. obraz zawartości pamięci oraz oblicza sumy kon- w nagraniu dowodowym utrwalono sygnalizację DTMF, trolne, na przykład algorytmem MD5, zarówno dla fi- zakłócenia wynikające z pracy telefonów komórkowych zycznego obszaru obrazowanej pamięci urządzenia oraz, i inne sygnały, które mają standardowe parametry cza- w celu weryfikacji, także dla jej obrazu. Ma to na celu sowe i częstotliwościowe, w celu weryfikacji tych para- zabezpieczenie pamięci nośnika w takim stanie, w jakim metrów można je również zarejestrować w nagraniach został on przekazany do badań, co ma istotne znaczenie testowych. dla wyników i wniosków wysnutych na tej podstawie W ramach badań autentyczności nagrań cyfrowych (Breeuwsma, De Jongh, klaver, Van Der knijff, Roe- wykonuje się również analizę struktury plików dźwię- loffs, 2007; casey, 2010). kowych. Pliki takie zawierają tzw. metadane, które opi- Przed przystąpieniem do realizacji nagrań testowych sują właściwe dane z zakodowanym dźwiękiem (Gloe, konieczna jest dokładna analiza audytywna oraz para- Fisher, kirchner, 2014; hong, Yin, 2013; koenig, Lacey, metrów i charakterystyk nagrania dowodowego w celu 2012). analizę taką przeprowadza się z wykorzystaniem ustalenia, jakie dźwięki i w jakich warunkach akustycz- oprogramowań umożliwiających wizualizację i edycję nych zostały zarejestrowane. Należy również zapoznać plików w postaci kodu szesnastkowego. się z możliwościami rejestracji, funkcjami urządzenia Metadane znajdujące się w obrębie plików dźwię- nagrywającego i opcjami zasilania, analizując instrukcję kowych zawierają istotne informacje z punktu widzenia obsługi i dostępne menu oraz oceniając stan techniczny. analizy ich autentyczności. W szczególności w obrębie Umożliwi to opracowanie planu wykonania nagrań testo- tzw. nagłówka, znajdującego się na początku struktury wych zawierającego opis ich realizacji, kolejność nagrań danych, odnaleźć można format zapisu i parametry pli- i sekwencji odtwarzanych dźwięków oraz zastosowa- ku multimedialnego. Dodatkowo w nagłówku zapisa- nych parametrów i funkcji. Jest on niezbędny zarówno ne mogą być: data i godzina rejestracji nagrania, czas do wykonania i archiwizacji tych czynności, jak i do trwania nagrania, marka i model urządzenia, wielkość późniejszej analizy nagrań. Dobrą i sprawdzoną prakty- pliku i rozmiar jego części z zakodowanym dźwiękiem. ką w trakcie realizacji każdego nagrania testowego jest Metadane zapisywane są również w obrębie tzw. tagów, słowny opis: daty i godziny początku oraz końca nagra- przykładowo w tagach iD3 stosowanych w popularnym nia, miejsca rejestracji i aktualnych warunków akustycz- formacie zapisu MP3. W wyniku edycji pliku z nagra- nych, marki i modelu urządzenia, zasilania, parametrów niem za pomocą oprogramowań przeznaczonych do tego zapisu i stosowanych funkcji oraz kolejno utrwalanych celu bardzo często powstają wpisy w strukturze pliku, na sygnałów. przykład w formacie XML lub XMP. Takie dodatkowe W trakcie rejestracji nagrań testowych w pomiesz- metadane, jak wskazuje praktyka, zapisywane są prze- czeniach izolowanych akustycznie generowane są sy- ważnie w końcowej części struktury danych edytowane-

Problems of Forensic Sciences 2016, vol. 105, 355–369 366 M. Michałek go pliku. Należy dodać, że aktualnie istnieje wiele róż- wbudowanych w rejestratory oraz wymiennych, zarów- nych formatów zapisu nagrań, przy czym każdy z nich no typu flash, jak i w postaci dysków MiniDisc. ma zwykle inną strukturę. Wykonanie nagrań testowych Przed przystąpieniem do nagrań testowych zapozna- stwarza możliwość analizy porównawczej ich struktury wano się szczegółowo ze zgromadzoną dokumentacją danych ze strukturą pliku dowodowego. techniczną każdego urządzenia, analizowano jego moż- Mogłoby się wydawać, że wykonanie nagrań testo- liwości rejestracji i stan techniczny oraz wykonywano wych w odniesieniu do pozostałych badań fonoskopij- dokumentację fotograficzną. nych jest stosunkowo proste w realizacji i polega głównie na włączeniu rejestracji, utrwaleniu żądanych dźwięków 3.2. cyfrowe nagrania dźwiękowe i wyłączeniu nagrywania. Jednakże, wbrew pozorom, jest to zadanie skomplikowane i czasochłonne. Wymaga Za pomocą zgromadzonych urządzeń utrwalono po- ono nie tylko szczegółowej analizy nagrania dowodowe- nad 720 cyfrowych nagrań dźwiękowych w 18 różnych go oraz wstępnego przygotowania urządzenia i plano- formatach zapisu. Po utrwaleniu w pamięci rejestratora wanych czynności, ale także rejestracji nagrań zgodnie każde z nagrań testowych zostało skopiowane na dysk z zaplanowanym harmonogramem, ich skopiowanie oraz twardy komputera laboratoryjnego celem dalszej analizy późniejszą żmudną analizę porównawczą względem nie- lub wykonano obraz zawartości pamięci urządzenia. kiedy wielu nagrań dowodowych. Nagrania testowe wykonano z wszystkimi możliwy- Już niedrogie i proste w obsłudze cyfrowe rejestra- mi ustawieniami zapisu badanych urządzeń oraz z wy- tory dźwięku oferują możliwość zmiany jakości zapisu, korzystaniem dostępnych funkcji, takich jak uruchomie- często jednak z wstępnie zaprogramowanymi ustawie- nie i zakończenie nagrywania, funkcja pauzy, aktywacja niami producenta. Urządzenia bardziej zaawansowane nagrywania poziomem głośności, indeksowanie, filtracja umożliwiają zmianę takich parametrów, jak liczba kana- szumów tła, jak również ewentualna edycja nagrań. Na- łów, częstotliwość próbkowania, rozdzielczość bitowa, grania testowe zrealizowane zostały w różnych warun- rejestracja w postaci skompresowanej lub bez kompresji kach akustycznych, utrwalając możliwie szeroki zakres oraz format zapisu. Dodatkowo posiadają wbudowany dźwięków. W izolowanych akustycznie pomieszcze- zegar z możliwością jego ustawienia, wyposażone są niach, za pomocą stanowiska komputerowego wyposażo- w funkcje pauzy lub automatycznego wstrzymywania nego w monitory odsłuchowe oraz słuchawki, odtwarza- i aktywacji nagrywania poziomem głośności, filtrację no i rejestrowano: szumy o szerokim paśmie częstotliwo- szumów, umożliwiają nawet edycję nagrań poprzez usu- ściowym, tony w zakresie niskich, średnich i wysokich wanie fragmentów lub ich montaż. Powyższe skutkuje częstotliwości, zakłócenia o charakterze impulsowym dużą liczbą możliwych kombinacji ustawień podczas i ciągłym, jak również wypowiedzi. Za pomocą bada- rejestracji, co przekłada się na liczbę nagrań testowych. nych rejestratorów utrwalano także dźwięki na otwartej W tabeli 1 zaprezentowano zestawienie możliwych do przestrzeni, które związane były z ruchem ulicznym, jak zmiany parametrów i funkcji dla dwóch przykładowych również wewnątrz poruszających się pojazdów. W opisa- rejestratorów dźwięku powszechnego użytku oraz wyni- nych powyżej warunkach akustycznych rejestrowano też kającą z tego liczbę kombinacji ustawień nagrywania dla wypowiedzi w stałych i zmiennych odległościach wzglę- dwukrotnego powtórzenia każdego ustawienia. Dodatko- dem mikrofonów urządzeń nagrywających. we funkcje lub parametry odpowiednio zwielokrotniają liczbę kombinacji ustawień. 4. Analiza właściwości badanych urządzeń i nagrań testowych 3. Materiał do badań Wykonanie nagrań testowych umożliwiło analizę 3.1. Rejestratory cyfrowe właściwości przebadanych urządzeń. Jak zaznaczono, w ramach badań zgromadzono i przeanalizowano bli- W celu wykonania badań zgromadzono i przeanali- sko 120 rejestratorów umożliwiających cyfrowy zapis zowano blisko 120 urządzeń dostępnych powszechnie dźwięku. W tabeli 2 przedstawiono wyniki analizy wła- i wyposażonych w funkcję cyfrowej rejestracji dźwięku, ściwości urządzeń wykorzystanych do rejestracji nagrań takich jak dyktafony, telefony komórkowe, odtwarzacze testowych, która zawiera zestawienie marek zgromadzo- multimedialne z funkcją nagrywania, tablety i kamery wi- nych rejestratorów, ich rodzajów, liczby formatów, moż- deo. Do badań wykorzystano urządzenia następujących liwości zmiany jakości zapisu dla dostępnych formatów marek: apple, BlackBerry, creative, hTc, JVc, LG, oraz rejestracji plików dźwiękowych bez kompresji lub Marantz, Nokia, Olympus, Panasonic, Pentagram, Phi- z kompresją zapisu. lips, Roland, Samsung, Siemens, Sony, Tascam, Toshiba, Za pomocą zgromadzonych rejestratorów utrwalo- Track i Zoom. Nagrania testowe utrwalano w pamięciach no nagrania testowe w 18 różnych formatach zapisu, tj.:

Problems of Forensic Sciences 2016, vol. 105, 355–369 Dźwiękowe nagrania testowe oraz ich wykorzystanie w badaniach autentyczności. Baza danych właściwości cyfrowych... 367

3GP, aiFF, aMR, BWF, DSS, M4a, MP2, MP3, MOD, stratory pozwalały na bezpośrednią kopię plików z ich OMa, OMG, PVc, WaVe aDPcM, WaVe PcM, VM1, pamięci na dysk twardy celem dalszej analizy. Na tej VY2 (VY4), VYF i WMa. W tabeli 3 przedstawiono podstawie ustalono, że każdy z badanych rejestratorów procentowy udział najczęściej występujących formatów automatycznie nadawał nazwy plikom z nagraniami we- w odniesieniu do ogólnej liczby wykonanych nagrań. dług ustalonego schematu. Przykładowe nazwy plików Przeprowadzona analiza wykazała, że nagrania testo- dźwiękowych dla konkretnych modeli urządzeń przed- we zarejestrowane zostały w zdecydowanej większości stawiono poniżej. Nazwy tych plików wskazują na: za pomocą dyktafonów cyfrowych i w trzech dominują- – model rejestratora i kolejny numer nagra- cych formatach zapisu, tj. WaVe aDPcM, WMa i MP3. nia: DS500001.WMa, WS650001.MP3 albo Większość badanych urządzeń umożliwiała rejestrację 801_0182 MP3 (marka Olympus i modele, odpowied- tylko w jednym formacie zapisu, jednak spora ich część nio, DS-50, WS-650S, WS-801), DR-100_0001.WaV pozwalała na wybór między dwoma, a nawet trzema róż- (Tascam DR-100), R09_0001.WaV (Roland eDiROL nymi formatami. W przypadku możliwości zapisu przez R-09); rejestrator w więcej niż dwóch formatach najczęściej – transfer za pomocą dedykowanego oprogramowania, spotykanymi były: WMa i MP3 (stosujące kompresję) oznaczenie folderu zapisu w pamięci urządzenia i nu- oraz WaVe PcM (bez kompresji zapisu). Pojedyncze mer nagrania: DW_a0001.WaV (oprogramowanie urządzenia spośród analizowanych umożliwiały zapis Digital Wave Player, folder a; nazewnictwo to stoso- w większej liczbie formatów niż trzy i były to głównie wane jest w przypadku rejestratorów Olympus i mo- zaawansowane technicznie rejestratory dźwięku. Przy- deli takich, jak VN-120Pc, VN-1100Pc, VN-2000Pc, kładem takiego urządzenia jest Marantz PMD671, który VN-2100Pc i VN-3100Pc); umożliwia zapis dźwięku w czterech różnych formatach, – datę albo datę i godzinę rejestracji: VN-20160216- w tym w dwóch nieskompresowanych, tj. WaVe PcM 00001.amr (BlackBerry 9320), recording-20130809- i BWF. Z przeprowadzonej analizy wynika również, że 121814.MP3 (Pentagram Tab 7.5), 001-2009-10-08 większość badanych urządzeń dla konkretnego formatu 11_49_40.oma (Sony MZ-Nh900); część nazwy pli- pozwala na wybór jakości zapisu i zmianę parametrów. ku zawierająca wskazanie czasu zależy od ustawień Do tej grupy zaliczyć można głównie dyktafony z za- zegara wbudowanego w urządzenie; pisem w formatach WMa, MP3 i WaVe PcM. Z ko- – numer nagrania: 1001.WaV (Marantz PMD671). lei urządzenia rejestrujące w formacie aMR, tj. przede Odnotowano również nazwy składające się z na- wszystkim telefony komórkowe, jak również niektóre stępujących oznaczeń: audio, Głos, Mic, MOB, Nagr, dyktafony i odtwarzacze z funkcją nagrywania w forma- Nagranie, Plik audio, Rec, Sound clip, Voice albo VOc cie WaVe aDPcM, nie umożliwiały zmiany parame- wraz z następującym po nim kolejnym numerem nagra- trów zapisu, a tym samym wyboru jakości. nia w pamięci urządzenia; takie nazwy plików z nagra- Ustalono, że parametry wszystkich zarejestrowa- niami cechują przede wszystkim telefony komórkowe nych nagrań testowych zawierały się w następujących oraz odtwarzacze z funkcją nagrywania. granicach: rozdzielczość 4–24 bitów na próbkę, często- Pliki dźwiękowe z nagraniami testowymi w każdym tliwość próbkowania 8–96 khz, przepływność bitowa analizowanym formacie zapisu posiadają bardziej lub 5–2304 kbps oraz zakres pasma częstotliwościowego mniej rozbudowane metadane z informacjami dotyczą- w przybliżeniu 3,8–40 khz. Małe wartości odpowiadają cymi: marki i modelu rejestratora, właściwości zapisu, nagraniom o niskiej jakości z wąskim pasmem częstotli- daty, godziny i czasu trwania nagrania lub ilości danych wościowym i zarejestrowanych za pomocą algorytmów w pliku. Jak zaznaczono wyżej, istotne informacje za- odznaczających się silną kompresją. Z kolei wartości warte są również w nazwach utrwalanych plików. duże charakteryzują nagrania o wysokiej jakości z szero- Na rysunku 1 zwizualizowano w postaci heksade- kim pasmem częstotliwościowym i utrwalonych głównie cymalnej (z lewej) i kodu aScii (z prawej) fragment w formacie nieskompresowanym WaVe PcM. struktury danych w pliku z nagraniem w formacie WaVe Wszystkie badane rejestratory umożliwiały wykona- aDPcM, czyli takim, który odnotowano najczęściej nie kopii plików z nagraniami na dysk twardy komputera wśród nagrań testowych. Na rysunku zaznaczono ob- z wykorzystaniem złącza cyfrowego. część z nich, głów- szar nagłówka pliku, który zawiera metadane z wpisami nie starsze modele, pozwalały na transfer plików z nagra- wskazującymi na liczbę danych w pliku (00 10 8e 34 niami jedynie za pomocą dedykowanego oprogramowa- bajtów w systemie szesnastkowym, zapis w postaci Lit- nia producenta instalowanego w systemie operacyjnym tle endian), format (WaVe aDPcM, kodek iMa, kod 00 komputera. Przykładowo, dyktafony Olympus i modele 11), podstawowe parametry zapisu (1 kanał, częstotli- serii VN wykorzystują program Digital Wave Player, wość próbkowania 22 050 hz, przepływność 88,8 kbps, z kolei rejestratory Sony zapisujące na wymiennych no- rozdzielczość 4 bity na każdą próbkę) oraz liczbę danych śnikach typu MiniDisc, tak jak model MZ-Nh900, wy- z zakodowanym dźwiękiem (00 10 8e 00 bajtów). magają instalacji programu SonicStage. Pozostałe reje-

Problems of Forensic Sciences 2016, vol. 105, 355–369 368 M. Michałek

Na szczególną uwagę zasługują pliki dźwiękowe PcM. Fragment widoku tabeli głównej wykonanej bazy utrwalane za pomocą rejestratorów marki Olympus, któ- danych przedstawiono na rysunku 3. re zawierają łatwe do zdekodowania wpisy wskazujące Zamieszczenie w bazie danych plików z nagraniami na markę i model urządzenia, datę i godzinę początku w źródłowym formacie umożliwia wykonanie analizy oraz końca rejestracji nagrania, czas trwania nagrania porównawczej ich parametrów zarówno pomiędzy ta- i jego numer oraz parametry zapisu dźwięku. Dane takie kimi samymi modelami danej marki, jak i analizowany- zapisywane są przez większość modeli wskazanej marki. mi nagraniami dowodowymi. Zgromadzenie w jednym Na rysunku 2 przedstawiono dwa fragmenty struk- miejscu usystematyzowanych danych o cyfrowych reje- tury danych pliku dźwiękowego zapisanego za pomocą stratorach dźwięku oraz o parametrach ich nagrań i pro- rejestratora Olympus WS-650S w drugim co do często- gramach do konwersji umożliwia szybki dostęp do istot- ści występowania formacie wśród nagrań testowych, nych informacji w trakcie badań fonoskopijnych i znacz- tj. WMa. Pierwszy fragment struktury (na rysunku nie oszczędza czas. Otwarta struktura skonstruowanej w części a) zawiera zaznaczone metadane z wpisami bazy pozwala na jej uzupełnianie o kolejne informacje wskazującymi na markę rejestratora (Olympus), model i nagrania. (WS650S), datę oraz godzinę początku i końca rejestra- Zwykle istnieje możliwość odtworzenia zarejestro- cji (2010.01.04 od 16:50:58 do 17:43:57) oraz czas trwa- wanego nagrania za pomocą urządzenia, którym zostało nia nagrania (00:52:59). Z kolei w drugim fragmencie ono zarejestrowane, jednakże w trakcie badań fonosko- (w części b) zaznaczono parametry zapisu nagrania, tj. pijnych wykorzystuje się profesjonalne oprogramowania format (WMa), przepływność (32 kbps), częstotliwość komputerowe służące do odtwarzania i analizy nagrań. próbkowania (44 khz) i liczbę kanałów (1). Zdarza się też, że zgromadzony materiał do badań nie Programy do automatycznej analizy plików multime- zawiera urządzenia, którym zarejestrowano nagranie dialnych podają niekiedy tylko niektóre parametry ich będące przedmiotem analizy. W związku z tym przeana- zapisu lub wartości te są niedokładne, zdarza się też, że lizowano możliwość odtwarzania utrwalonych nagrań w ogóle nie rozpoznają danego formatu. Wtedy głów- testowych w ich formatach źródłowych oraz konwersję nym źródłem informacji o takim pliku jest analiza jego do formatu standardowego i nieskompresowanego, tj. struktury danych w edytorze szesnastkowym, którą po- WaVe PcM, za pomocą programów komputerowych. krótce opisano wyżej. Odtworzenie w źródłowym formacie daje często moż- liwość wstępnej oceny nagrania i ustalenie utrwalonych w nim treści. Z kolei konwersja do postaci WaVe PcM 5. baza danych właściwości cyfrowych umożliwia import nagrania do przestrzeni roboczej pro- rejestratorów dźwięku i nagrań oraz fesjonalnych programów w celu wykonania badań odsłu- możliwości ich konwersji do formatu chowych i spisania treści, analizy charakterystyk czaso- WaVe pcm wych i częstotliwościowych w trakcie badań autentycz- ności, jak również parametrów sygnału mowy podczas W ramach wykonanych prac wszystkie rejestratory, badaniach identyfikacyjnych mówców. za pomocą których utrwalono nagrania testowe, zostały Popularne obecnie formaty zapisu nagrań, takie jak jednolicie skatalogowane. W katalogu głównym każdego WaVe PcM i aDMcP, MPeG-1 i MPeG-2 audio Lay- z nich znajdują się pogrupowane informacje dotyczące er iii (MP3), WMa, 3GP lub aMR są dobrze znane dokumentacji technicznej i fotograficznej, oprogramo- i udokumentowane (3GPP, 2010; 3GPP, 2011; iSO/iec, wania do konwersji z formatu źródłowego do standardo- 1992; Microsoft corp., 1994, Microsoft corp., 2010). wego i nieskompresowanego WaVe PcM oraz nagrania Dostępnych jest również wiele użytecznych narzędzi po- testowe w formacie źródłowym i przekonwertowane do zwalających na ich analizę oraz odtwarzanie i konwersję WaVe PcM. do formatu nieskompresowanego WaVe PcM. Jednak Zbiór skatalogowanych i usystematyzowanych in- niektórzy producenci cyfrowych rejestratorów dźwięku formacji stanowił podstawę do skonstruowania relacyj- stosują własne i niestandardowe formaty zapisu z bardzo nej bazy danych w oprogramowaniu Microsoft access ubogą lub w ogóle pozbawione ogólnodostępnej doku- wraz z interfejsem użytkownika. Przedmiotowa baza mentacji. Problematyczne staje się wówczas odtworze- dla każdego zbadanego urządzenia zawiera następujące nie takiego nagrania oraz wykonanie jego konwersji do informacje: rodzaj urządzenia, opis marki i modelu, do- formatu WaVe PcM w celu analizy w odpowiednim kumentację, wskazanie możliwości rejestracji (audio lub oprogramowaniu. Może również okazać się, że analiza wideo), wykaz dostępnych formatów zapisu i rozszerzeń struktury danych plików z takimi nagraniami i zdekodo- plików dźwiękowych, opis podstawowych parametrów wanie metadanych możliwe jest jedynie w ograniczonym nagrań, dostęp do katalogu z plikami w źródłowych for- zakresie. matach zapisu i przekonwertowanych oraz do katalogu Wśród darmowych programów, które umożliwiają z programami do konwersji nagrań do formatu WaVe odtworzenie lub konwersję większości standardowych

Problems of Forensic Sciences 2016, vol. 105, 355–369 Dźwiękowe nagrania testowe oraz ich wykorzystanie w badaniach autentyczności. Baza danych właściwości cyfrowych... 369 formatów zapisu do WaVe PcM, wyróżnić można na- Podziękowania stępujące: Pazera Free audio extractor obsługiwany Opisane w niniejszym artukule prace zostały wykonane z linii poleceń ffmpeg i powiązany z nim ffplay, Mobile w ramach projektu badawczego nr X/k zrealizowanego Media converter oraz VLc media player. Podczas ba- w instytucie ekspertyz Sądowych im. Prof. dra Jana Seh- dań wykorzystano również profesjonalne oprogramowa- na w krakowie. nie adobe audition. Wymienione programy umożliwiły przekonwertowanie zarejestrowanych nagrań testowych z następujących formatów: WaVe aDPcM, WMa, aMR, MP3, MP2, 3GP, M4a, aiFF, MOD i BWF do postaci nieskompresowanej WaVe PcM. Dla nagrań testowych utrwalonych w mało popu- larnych formatach do ich odtworzenia i konwersji do formatu WaVe PcM niezbędne było wykorzystanie dedykowanych programów producenta konkretnego rejestratora. Zgromadzone nagrania testowe w plikach dźwiękowe o rozszerzeniach: VM1, PVc, DSS, VY2 (VY4), VYF oraz OMa i OMG mogą zostać odtworzo- ne oraz przekonwertowane za pomocą oprogramowań, odpowiednio: Voice editing, Voice editing Mini Player i Voice editing, DSS Player Lite i DSS Player v.7, Voice yepp Player i WaV_converter, Samsung Voice Manager oraz SonicStage.

6. podsumowanie

W pracy opisano znaczenie i wykorzystanie dźwięko- wych nagrań testowych do celów badania autentyczności nagrań dowodowych. Przedstawiono właściwości prze- badanych urządzeń z funkcją rejestracji dźwięku i pa- rametry utrwalonych za ich pomocą nagrań testowych, a także skonstruowaną na tej podstawie bazę danych. Zebrany i usystematyzowany zbiór danych pozwala na szybką weryfikację parametrów konkretnego modelu re- jestratora i jego nagrań, jak również ustalenie oprogra- mowania do konwersji z formatu źródłowego do PcM WaVe, co umożliwia dalszą analizę nagrań. Otwarta struktura skonstruowanego zbioru pozwala na jego ak- tualizowanie i uzupełnianie o nowe dane wraz z analizą kolejnych modeli urządzeń umożliwiających rejestrację nagrań. Wyniki przeprowadzonych badań i przedmiotowa baza danych są wykorzystywane w bieżącej działalności opiniodawczej jako narzędzie wpomagające w badaniach autentyczności nagrań. Należy dodać, że tworzony zbiór informacji o cyfrowych urządzeniach rejestrujących i ich nagraniach z całą pewnością może być być pomocny do badań nie tylko z zakresu fonoskopii, ale także w obsza- rach pokrewnych, na przykład w informatyce sądowej. Stanowi również dostateczny materiał do przeprowadze- nia innych badań z zakresy analizy nagrań dźwiękowych.

Problems of Forensic Sciences 2016, vol. 105, 355–369