Komponenter i multimedia. Multimedia komponenter. Strukturelle komponenter i multimedia

I dag er begrepet "multimedia" ganske klart - det er en kombinasjon i seg selv av velkjente metoder for å overføre informasjon, for eksempel bilder, tale, skriving, bevegelser. Denne kombinasjonen er som regel dypt gjennomtenkt, satt sammen av forskjellige elementer som utfyller hverandre for å skape et helhetlig forståelig bilde. Alt dette kan observeres på nesten hver informasjonsressurs, for eksempel en nyhetsfeed med bilder eller vedlagte videoer. Prosjektet kan enten være tydelig formet, når historien bygges av skaperen og fortsetter lineært, og det finnes også flere andre typer, som interaktivitet og transmedia, som gjør plottet ikke-lineært og skaper muligheter for brukeren til å skape sitt eget scenario. Alt dette er en ekstra avansert funksjon for å lage mer interessant innhold som brukeren vil komme tilbake til igjen og igjen.

Hovedsaken i konseptet "multimedia" er at kombinasjonen av grunnleggende medieelementer er basert på en datamaskin eller hvilken som helst digital teknologi. Det følger at standardkomponentene til multimedia har en mer utvidet betydning Vaughan, T. Multimedia: Making it work (7. utgave). New Delhi: Mac-Graw Hill. 2008. s. 1-3, 25-40, 53-60:

1. Tekst. Skriftspråk er den vanligste måten å overføre informasjon på, og er en av hovedkomponentene i multimedia. Opprinnelig var det trykte medier som bøker og aviser som brukte forskjellige fonter for å vise bokstaver, tall og spesialtegn. Til tross for dette inkluderer multimedieprodukter bilder, lyd og video, men tekst kan være den vanligste typen data som finnes i multimedieapplikasjoner. Dessuten gir tekst også muligheter til å utvide den tradisjonelle kraften ved å knytte den til andre medier, slik at den blir interaktiv.

en. Statisk tekst. I statisk tekst er ord ordnet for å passe godt inn i det grafiske miljøet. Ordene er innebygd i grafene på samme måte som grafer og forklaringer er plassert på sidene i en bok, noe som betyr at informasjonen er gjennomtenkt og det er mulighet for ikke bare å se på fotografiene, men også lese tekstinformasjonen. Kindersley, P. (1996). Multimedia: Den komplette guiden. New York: DK..

b. Hypertekst. Et hypertekstfilsystem består av noder. Den inneholder tekst og koblinger mellom noder som definerer stier som en bruker kan bruke for å få tilgang til teksten på en inkonsekvent måte. Lenker representerer assosiasjoner av mening og kan betraktes som kryssreferanser. Denne strukturen er laget av forfatteren av systemet, selv om brukeren i mer komplekse hypertekstsystemer kan definere sine egne veier. Hypertekst gir brukeren fleksibilitet og valgmuligheter når han beveger seg gjennom materialet. Godt formaterte setninger og avsnitt, mellomrom og tegnsetting bidrar også til tekstens lesbarhet.

2. Lyd. Lyd er det mest sanselige elementet i multimedia: det er direkte tale på alle språk, fra en hvisking til et rop; det er noe som kan gi glede ved å lytte til musikk, skape en slående bakgrunnseffekt eller stemning; dette er noe som kan skape et kunstnerisk bilde, og legge til effekten av tilstedeværelsen av en forteller til et tekstnettsted; vil hjelpe deg å lære hvordan du uttaler et ord på et annet språk. Lydtrykknivået måles i desibel, som bør være innenfor området tilstrekkelig lydvolum til å oppfattes av det menneskelige øret.

en. Digitalt grensesnitt for musikkinstrumenter (Musical Instrument Digital Identifier - MIDI). MIDI er en kommunikasjonsstandard utviklet på begynnelsen av 1980-tallet for elektroniske musikkinstrumenter og datamaskiner. Det er en stenografi av musikk lagret i numerisk form. MIDI er det raskeste, enkleste og mest fleksible verktøyet for å komponere partiturer i et multimediaprosjekt. Kvaliteten avhenger av kvaliteten på musikkinstrumentene og lydsystemets evner. Vaughan, T. Multimedia: Få det til å fungere (7. utgave). New Delhi: Mac-Graw Hill. 2008. s.106-120

b. Digitalisert og innspilt lyd (Digital Audio). Digitalisert lyd er en prøve der hver brøkdel av et sekund tilsvarer en lydprøve lagret som digital informasjon i biter og byte. Kvaliteten på dette digitale opptaket avhenger av hvor ofte prøver tas (samplingsfrekvens) og hvor mange tall som brukes for å representere verdien av hver prøve (bitdybde, prøvestørrelse, oppløsning). Jo oftere en prøve tas og jo mer data lagres om den, jo bedre oppløsning og kvaliteten på den fangede lyden når den spilles av. Kvaliteten på digital lyd avhenger også av kvaliteten på den originale lydkilden, opptaksenhetene som støtter programvaren og avspillingsmulighetene til miljøet.

3. Bilde. Det representerer viktig komponent multimedia, siden det er kjent at en person mottar mesteparten av informasjonen om verden gjennom visjon, og bildet er alltid det som visualiserer teksten Dvorko, N. I. Fundamentals of directing multimedia programmer. SPbSUP, 2005. ISBN 5-7621-0330-7. - Med. 73-80. Bilder er datagenerert på to måter, som rasterbilder og også som vektorbilder Vaughan, T. Multimedia: Making it work (7. utgave). New Delhi: Mac-Graw Hill. 2008. s.70-81.

en. Raster- eller bitmapbilder. Den vanligste formen for lagring av bilder på en datamaskin er et raster. Dette enkel matrise består av bittesmå prikker kalt piksler som danner et rasterbilde. Hver piksel består av to eller flere farger. Fargedybden bestemmes av mengden data i biter som brukes til å bestemme antall farger, for eksempel er en bit to farger, fire biter er seksten farger, åtte biter er 256 farger, 16 biter er 65 536 farger, og så videre. Avhengig av maskinvarefunksjoner kan hver prikk vise mer enn to millioner farger. En stor bildestørrelse betyr at bildet vil se mer ekte ut sammenlignet med det øyet ser eller originalproduktet. Dette betyr at proporsjoner, størrelse, farge og tekstur må være så presise som mulig.

b. Vektorbilder. Opprettelsen av slike bilder er basert på å tegne elementer eller objekter som linjer, rektangler, sirkler og så videre. Fordelen med et vektorbilde er at mengden data som kreves for å representere bildet er relativt liten og derfor ikke krever stor lagringsplass. Et bilde består av et sett med kommandoer som utføres ved behov. Et rasterbilde krever et visst antall piksler for å produsere riktig høyde, bredde og fargedybde, mens et vektorbilde er basert på relativt begrensede mengder tegnekommandoer. Forringelse av kvalitet vektorbilder er det begrensede detaljnivået som kan representeres i et bilde. Komprimering brukes til å redusere filstørrelsen på et bilde, noe som er nyttig for å lagre et stort antall bilder og øke overføringshastigheten til bilder. Kompresjonsformater som brukes til dette formålet er GIF, TIFF og JPEG Hillman, D. Multimedia: Teknologi og applikasjoner. New Delhi: Galgotia. 1998..

4. Video. Det er definert som visning av registrerte virkelige hendelser på en TV-skjerm eller dataskjerm. Å bygge inn video i multimedieapplikasjoner er en kraftig måte å formidle informasjon på. Det kan inkludere personlighetselementer som andre medier mangler, for eksempel å vise presentatørens personlighet. Videoer kan deles inn i to typer, analog video og digital video.

en. Analog video. Denne typen videodata lagres på alle ikke-datamaskiner, for eksempel videokassetter, laserskiver, filmer osv. De er delt inn i to typer, kompositt og komponent analog video:

Jeg. Composite Analog Video har alle videokomponenter, inkludert lysstyrke, farge og timing, kombinert til ett signal. På grunn av sammensetningen eller kombinasjonen av videokomponenter, mister den resulterende videokvaliteten farge, reduserer klarheten og lider tap av ytelse. Tap av produktivitet betyr tap av kvalitet ved kopiering for redigering eller andre formål. Dette opptaksformatet ble brukt til å ta opp video på magnetbånd som Betamax og VHS. Komposittvideo er også utsatt for tap av kvalitet fra en generasjon til den neste.

ii. Analog komponentvideo anses som mer avansert enn komposittvideo. Den tar de ulike komponentene i videoen, som farge, lysstyrke og timing, og bryter dem ned i individuelle signaler. S-VHS og HI-8 er eksempler på denne typen analog video, der farge og lysstyrke er lagret på ett spor og informasjon på et annet. På begynnelsen av 1980-tallet ga Sony ut et nytt bærbart, profesjonelt videoformat som lagret signaler på tre separate spor.

b. Digital Video er det mest spennende multimediemediet som er et kraftig verktøy for å bringe databrukere nærmere den virkelige verden. Digital video krever en stor mengde lagringsplass fordi mens et stillbilde av høy kvalitet på en dataskjerm krever én megabyte eller mer lagringsplass, må bildet endres for å få bevegelse til å vises. i det minste, tretti ganger per sekund, og krever tretti megabyte lagringsminne for ett sekund med video. Dermed, jo flere ganger bildet byttes ut, jo bedre kvalitet video. Video krever høy båndbredde for å overføre data i et nettverksmiljø. Det finnes digitale videokomprimeringsordninger for dette. Det er videokomprimeringsstandarder som MPEG, JPEG, Cinepak og Sorenson. I tillegg til videokomprimering finnes det strømmeteknologier som f.eks Adobe Flash, Microsoft Windows Media, QuickTime og Real Player, som gir akseptabel videoavspilling på lav Internett-båndbredde. QuickTime og Real Video er de mest brukte for bred distribusjon. Digitale videoformater kan deles inn i to kategorier, komposittvideo og komponentvideo.

Jeg. Sammensatte digitale opptaksformater koder informasjon til binært system(0 og 1). Den beholder noen av svakhetene til analog komposittvideo, som farge- og bildeoppløsning, samt kvalitetstap når du lager kopier.

ii. Component digital er ukomprimert og har svært høy bildekvalitet, noe som gjør det svært kostbart.

iii. Video kan gjøre mange ting. Videoopptak kan forbedre forståelsen av et emne hvis forklaringen er konsistent. Hvis vi for eksempel ønsker å vise dansetrinn brukt i forskjellige kulturer, vil en video reflektere dette lettere og mer effektivt. Vaughan, T. Multimedia: Få det til å fungere (7. utgave). New Delhi: Mac-Graw Hill. 2008. s.165-170

I dag utvikler multimedia seg veldig raskt på feltet informasjonsteknologier. Datamaskinens evne til å behandle forskjellige typer Bruken av media gjør dem egnet for et bredt spekter av bruksområder, og viktigst av alt, flere og flere har muligheten til ikke bare å se på ulike multimediaprosjekter, men også lage dem selv.

Forelesning 12

"Applikasjon multimedieteknologier»

Introduksjon

Studiespørsmål:

1. Multimedieteknologier – grunnleggende konsepter.

2. Klassifisering og strukturelle komponenter i multimedia.

3. Multimedieinformasjonsformater.

4. Maskinvare og programvare for multimedieinformasjon.

Konklusjon

Introduksjon

Midler for presentasjon, lagring og formidling av informasjon har alltid fulgt og formet menneskelig sivilisasjon. Mennesker innen informasjonsteknologiutvikling har kommet langt fra bøker og post via radio, telegraf, telefon til multimedia arbeidsstasjon, som kombinerer alle mulighetene for å jobbe med informasjon i form av tekst, grafikk, lyd, video og tv-bilder.

Enhver person som subjekt informasjonssamfunnet, må kunne operere i rommet med ulike typer informasjon. Informasjonssamfunnets presserende oppgave er med andre ord dannelsen av en grunnleggende ny informasjonskultur. Det manifesterer seg i evnen til å søke etter nødvendige data i ulike informasjonskilder; evne til å bruke datateknologi i sine aktiviteter; mestre praktiske måter å jobbe med ulike, inkludert multimedia, informasjon.

1. Multimedieteknologier – grunnleggende konsepter.

Multimedia- interaksjon av visuelle og lydeffekter under interaktiv kontroll programvare ved hjelp av moderne teknisk og programvare, kombinerer de tekst, lyd, grafikk, bilder, video i én digital representasjon.

Begrepet "multimedia" kan oversettes fra engelsk til "mange miljøer" (fra multi - mange og media - miljø).

For tiden er multimedieteknologier et raskt utviklende område innen informasjonsteknologi. Et betydelig antall store og små firmaer, tekniske universiteter og studioer (spesielt IBM, Apple, Motorola, Philips, Sony, Intel, etc.) jobber aktivt i denne retningen. Bruksområdene er ekstremt mangfoldige: interaktive pedagogiske og Informasjonssystemer, CAD osv.

Hoved karakteristisk egenskaper disse teknologiene er:

Kombinere et multi-komponent informasjonsmiljø (tekst, lyd, grafikk, bilder, video) i en homogen digital representasjon;

Sikre pålitelig (ingen forvrengning ved kopiering) og varig lagring (garantert lagringsperiode er titalls år) av store mengder informasjon;

Enkel informasjonsbehandling (fra rutine til kreative operasjoner).

Det oppnådde teknologiske grunnlaget er basert på bruk av en ny optisk mediestandard DVD (Digital Versalite/Video Disk) Digital Versatile Disc - digital multifunksjonsplate ), som har en kapasitet i størrelsesorden enheter og titalls gigabyte og erstatter alle tidligere: CD-ROM, Video-CD, CD-lyd. Bruken av DVD gjorde det mulig å realisere konseptet digital informasjonshomogenitet. Én enhet erstatter en lydspiller, videoopptaker, CD-ROM, diskstasjon, skyveknapp osv. Når det gjelder informasjonspresentasjon, bringer den optiske medie-DVDen den nærmere nivået av virtuell virkelighet.

Det er tilrådelig å dele multi-komponent multimediemiljøet inn i tre grupper: lyd, video, tekstinformasjon.

Lydsekvens kan inkludere tale, musikk, effekter (lyder som støy, torden, knirking osv., forenet med betegnelsen WAVE (bølge). Hovedproblemet ved bruk av denne gruppen multimedia er informasjonskapasitet. Å ta opp ett minutt med WAVE-lyd høyeste kvalitet et minne på ca. 10 MB kreves, så standard CD-størrelse (opptil 640 MB) lar deg ikke ta opp mer enn en time med WAVE. For å løse dette problemet, brukesder.

En annen retning er bruken av MIDI (Musical Instrument Digitale Interface) lyder i multimedia (single og polyfonisk musikk, opp til et orkester, lydeffekter). I dette tilfellet syntetiseres lydene fra musikkinstrumenter og lydeffekter av programvarestyrte elektroniske synthesizere. Korrigering og digital opptak av MIDI-lyder utføres ved hjelp av musikkredigerere (sequencer-programmer). Den største fordelen med MIDI er den lille mengden minne som kreves - 1 minutt med MIDI-lyd tar i gjennomsnitt 10 KB.

Videosekvens Sammenlignet med lyd er den preget av et stort antall elementer. Det er statiske og dynamiske videosekvenser.

Statisk videosekvens inkluderer grafikk (tegninger, interiør, overflater, symboler i grafisk modus) og bilder (bilder og skannede bilder).

Dynamisk videosekvens er en sekvens av statiske elementer (rammer). Tre typiske grupper kan skilles:

· vanlig video (livsvideo) – en sekvens av fotografier (ca. 24 bilder per sekund);

· kvasi-video – en sparsom sekvens av fotografier (6–12 bilder per sekund);

· animasjon – en sekvens av håndtegnede bilder.

Første problem ved implementering av videosekvenser - skjermoppløsning og antall farger. Det er tre retninger:



· VGA-standarden gir en oppløsning på 640 ´ 480 piksler (punkter) på skjermen med 16 farger eller 320 ´ 200 piksler med 256 farger;

· SVGA-standard (videominne 512 KB, 8 bits/piksel) gir en oppløsning på 640 ´ 480 piksler med 256 farger;

· 24-bits videoadaptere (2 MB videominne, 24 bits/piksel) tillater bruk av 16 millioner farger.

Andre problem- Minne. For statiske bilder en Full skjerm Krever følgende mengder minne:

i 640 ´ 480-modus, 16 farger – 150 kbyte;

i 320 ´ 200-modus, 256 farger – 62,5 kbyte;

i 640 ´ 480-modus, 256 farger – 300 kbyte.

Slike betydelige volumer i implementeringen av lyd- og videosekvenser bestemmer høye krav til lagringsmediet, videominnet og informasjonsoverføringshastigheten.

Ved plassering tekst informasjon på en CD-ROM er det ingen vanskeligheter eller begrensninger på grunn av det store informasjonsvolumet på den optiske platen.

Hovedretninger bruk av multimedieteknologi:

· Underholdningsbransjen;

· opprettelse av personlige lyd- og videobiblioteker;

· datasimulatorer;

· dataspill;

· treningsprogrammer;

· leksikon;

· elektroniske publikasjoner for pedagogiske formål, etc.;

· i telekommunikasjon med en rekke mulige bruksområder fra å se et tilpasset TV-program og velge riktig bok til å delta i multimediekonferanser. Slike utviklinger kalles Information Highway;

· multimedieinformasjonssystemer ("multimediekiosker") som gir visuell informasjon på brukerforespørsel.

Fra et teknisk synspunkt tilbyr markedet både fullt utstyrte multimediedatamaskiner og individuelle komponenter og undersystemer (Multimedia Upgrade Kit), som bl.a. lydkort, CD-stasjoner, styrespaker, mikrofoner, høyttalersystemer.

Til personlige datamaskiner IBM PC-klassen, har en spesiell MPC-standard blitt godkjent, definerende minimal konfigurasjon maskinvare for å spille av multimedieprodukter. Til optiske disker CD-ROM har utviklet en internasjonal standard (ISO 9660).

Dermed, multimedia– samtidig bruk av ulike former for informasjonsrepresentasjon og dens behandling i et enkelt beholderobjekt. For eksempel kan et enkelt beholderobjekt inneholde tekst-, auditiv-, grafikk- og videoinformasjon, og muligens en måte å samhandle med det interaktivt. Begrepet multimedia brukes også ofte for å referere til lagringsmedier som kan lagre betydelige mengder data og gi tilstrekkelig rask tilgang til dem (de første mediene av denne typen var CD-ROM-er). I et slikt tilfelle betyr begrepet multimedia at en datamaskin kan bruke slike medier og gi informasjon til brukeren gjennom alle mulige typer data som lyd, video, animasjon, grafikk og annet i tillegg til tradisjonelle måter presentasjon av informasjon som tekst.

Klassifisering og strukturelle komponenter i multimedia

Multimedia, avhengig av måten informasjon presenteres på, kan presenteres følgende grupper:

Lineær . En analog av den lineære fremstillingsmetoden er kino. Personen som ser på dette dokumentet kan ikke på noen måte påvirke konklusjonen.

Ikke-lineær . Den ikke-lineære måten å presentere informasjon på lar en person delta i produksjonen av informasjon ved å samhandle på en eller annen måte med midler for å vise multimediadata. Menneskelig deltakelse i denne prosessen kalles også interaktivitet.

Den ikke-lineære måten å representere multimediedata på kalles noen ganger " hypermedia ».

Som et eksempel på en lineær og ikke-lineær måte å presentere informasjon på, kan vi vurdere en situasjon som å gi en presentasjon. Hvis presentasjonen ble tatt opp på film og vist til publikum, kan denne metoden for å formidle informasjon kalles lineær, siden de som ser på denne presentasjonen ikke har mulighet til å påvirke foredragsholderen. I tilfelle av en live presentasjon har publikum mulighet til å samhandle med foredragsholderen (for eksempel stille ham spørsmål), noe som gjør at han kan avvike fra temaet for presentasjonen, klargjøre noen begreper eller dekke kontroversielle deler av rapporten i flere detaljer. Dermed kan en levende presentasjon presenteres som en ikke-lineær (interaktiv) måte å presentere informasjon på.

Multimedia som pedagogisk emne dukket opp relativt nylig. Multimedieteknologi begynte å bli studert som en uavhengig akademisk disiplin ved russiske universiteter først på begynnelsen av 90-tallet. I russisk praksis møter undervisning i multimedieteknologi visse vanskeligheter forårsaket av ulike årsaker. En av de vanligste årsakene er knyttet til problemet med teknisk utstyr ved universiteter med dyre multimediasystemer som er nødvendige for å fullt ut trene studenter i "Multimedia Technology" -kurset. Et annet problem er forbundet med utilstrekkelig kunnskap om dette fagområdet på grunn av dets nyhet, samt den raske utviklingen av multimedieteknologier. Dannelsen av konseptapparatet til dette fagområdet er i den innledende utviklingsfasen.

Kapittel 1: Introduksjon til multimedia

1.1. Definisjon og konsept av multimedia

Multimedia(Engelsk multimedia fra det latinske multum - mange og medium - betyr) - et sett med maskinvare og programvare som lar brukeren jobbe interaktivt med heterogene data (grafikk, tekst, lyd, video), organisert i form av et enkelt informasjonsmiljø .

At. multimedieteknologi er en spesiell type datateknologi som kombinerer både tradisjonell statisk visuell informasjon (tekst, grafikk) og dynamisk informasjon – tale, musikk, videoklipp, animasjon, etc.

Multimedieressurser skiller seg fra "ikke-multimediale" først og fremst ved at:

1) data (informasjon) lagres og behandles i digital form ved hjelp av en datamaskin;

2) de kan inneholde ulike typer informasjon (ikke bare tekst, men også lyd, grafikk, animasjon, video osv.);

3) deres essensielle funksjon er interaktivitet - aktiv interaksjon av en ressurs, program, tjeneste og person, deres gjensidige innflytelse. En bruker kan ta dette eller det Internett-produktet, for eksempel, og umiddelbart legge til sitt eget materiale til det, og dermed fungere som dets medforfatter, medskaper;

4) tilstedeværelsen av hypertekst.

1.2. Historie om multimediautvikling

Drivkraften for utviklingen av multimedia skjedde i 1980. Rundt denne tiden dukket selve begrepet "multimedia" opp.

I Russland dukket multimedia opp rundt slutten av 80-tallet, og det ble ikke brukt på hjemmedatamaskiner, men ble bare brukt av spesialister.

Det var først i 1993 at mange mennesker forsto eller begynte å forstå viktigheten av retning, for å innse hvilken rolle multimedieteknologien skulle spille på 90-tallet. Ordet "multimedia" har plutselig blitt så fasjonabelt i landet vårt. Nye team av utviklere av systemer og endelige multimediaprodukter ble dannet; Det har dukket opp forbrukere av slike systemer og produkter, og de er veldig utålmodige. Konferansen, som ble holdt 25.-26. februar 1993, så ut til å åpne multimediesesongen i Russland.

1994 kan trygt kalles året for begynnelsen av hjemme-multimediaboomen i det russiske datamarkedet. Og i disse dager har nesten alle med en datamaskin multimedia, og programvare selges overalt og i forskjellige typer, det vil si at multimedia har blitt vanlig.

    Tekst

Tekst er et ordnet sett med setninger designet for å uttrykke en bestemt mening. Tekstens semantiske integritet gjenspeiler de forbindelsene og avhengighetene som eksisterer i selve virkeligheten (sosiale hendelser, naturfenomener, ytre utseende og indre verden, etc.).

Tekstoppfatning studeres i slike disipliner som tekstlingvistikk og psykolingvistikk.

En tekstfil er en vanlig form for å representere tekst på en datamaskin. Hvert tegn fra tegnsettet som brukes er kodet som én byte, og noen ganger som en sekvens av to, tre eller flere byte på rad.

En spesiell type tekstdata bør betraktes som den såkalte. hypertekst. Begrepet "hypertekst" ble laget av Ted Nelson i 1965 for å bety "tekst som forgrener eller utfører på forespørsel." Vanligvis er hypertekst representert som et sett med tekster som inneholder overgangsnoder fra en tekst til en annen, slik at du kan velge informasjonen som skal leses eller lesesekvensen. Et velkjent og dessuten uttalt eksempel på hypertekst er nettsider - dokumenter i HTML (hypertext markup language) lagt ut på Internett.

Det er stilistiske, sjangere og tematiske klassifiseringer av tekst.

    Lyd

Lyd (fra latin lyd - "jeg hører") er et generelt begrep relatert til lydteknologi. Med lyd menes som regel lyd tatt opp på et lydmedium, samt lydopptak og -avspilling, lydopptak og lydgjengivelsesutstyr.

Dermed er den auditive komponenten av multimedieinformasjon designet for å formidle lyddata. Som et fysisk fenomen studeres lyd innenfor rammen av akustikk, men akustikk er en tverrfaglig vitenskap som bruker et bredt spekter av disipliner for å løse sine problemer: matematikk, fysikk, psykologi, arkitektur, elektronikk, biologi, musikkteori osv. Direkte relatert til spørsmål om multimedieteknologi har slike områder av moderne akustikk som musikalsk akustikk, elektroakustikk, taleakustikk, digital akustikk.

    En viss tonehøyde (vanligvis fra 16 til 4500 Hz);

    Timbre, som bestemmes av tilstedeværelsen av overtoner i lyden og avhenger av lydkilden;

    Et volum som ikke kan overskride smerteterskelen;

    Varighet.

Talelyd dannes av det menneskelige uttaleapparatet for språklig kommunikasjon. Talelyder er delt inn i lyder og toner. Toner i talen oppstår fra vibrasjonen av stemmebåndene; støy dannes på grunn av ikke-periodiske svingninger av luftstrømmen som forlater lungene. Fra et akustikksynspunkt er talelyder vibrasjoner av et elastisk medium som har et visst spektrum, intensitet og rekkevidde. Den mest kjente egenskapen til et talesignal er tonehøyden. Denne karakteristikken representerer den vanlige frekvensmodulasjonen til et signal, hvis parametere lett kan måles. Perioden for grunntonen til forskjellige mennesker (menn, kvinner, barn) er i området 50-250 Hz.

Blant lydmediene skilles analoge og digitale medier ut. For multimedieteknologier er sistnevnte av størst betydning, og disse er hovedsakelig lydfiler, hvorav et betydelig antall ble utviklet i i fjor. Klassifiseringen av lydfilformater inkluderer tapsfrie og tapsfrie formater. Tapsfrie lydformater er designet for å representere lyd nøyaktig (med samplingshastighetsnøyaktighet). På sin side er de delt inn i ukomprimerte og komprimerte formater.

Eksempler på ukomprimerte formater:

    RAW – råmålinger uten overskrift eller synkronisering;

    WAV (Waveform audio format) – utviklet av Microsoft sammen med IBM, en vanlig form for å representere kortvarige lyddata;

    CDDA er en standard for lyd-CDer. Den første utgaven av standarden ble utgitt i juni 1980 av Philips og Sony, deretter ble den ferdigstilt av Digit Audio Disk Committee.

Eksempler på komprimerte formater:

    WMA (Windows Media Audio 9 Lossless) er et lisensiert lydfilformat utviklet av Microsoft for lagring og kringkasting. Innenfor formatet er det mulighet for lydkoding, både tapsfri og tapsfri kvalitet.

    FLAC (Free Audio Lossless Audio Codec) er et populært format for komprimering av lyddata. Støttes av mange lydapplikasjoner så vel som lydavspillingsenheter.

Tapslydformater er først og fremst rettet mot å lagre lyddata så kompakt som mulig: men perfekt nøyaktig gjengivelse av den innspilte lyden er ikke garantert. Eksempler på slike formater:

    MP3 er et lisensiert filformat for lagring av lydinformasjon utviklet av arbeidsgruppe Fraunhofer MPEG Institute i 1994. På dette øyeblikket MP3 er den mest kjente og populære av de vanlige digitale lydkodingsformatene med tap. Det er mye brukt i fildelingsnettverk for å overføre musikk. Formatet kan spilles i alle moderne operativsystem, på nesten alle bærbare lydspillere, og støttes også av alle moderne modeller musikksentre og DVD-spillere.

    Vorbis er et gratis lydkomprimeringsformat som dukket opp sommeren 2002. Den psykoakustiske modellen som brukes i Vorbis ligner i prinsippet på MP3. I følge ulike estimater er dette formatet det nest mest populære lydkomprimeringsformatet etter MP3. Mye brukt i dataspill og i fildelingsnettverk for overføring av musikk.

    AAC (Advanced Audio Coding) er et lydfilformat med mindre kvalitetstap under koding enn MP3 med samme størrelse. Den ble opprinnelig laget som en MP3-mottaker med forbedret kodingskvalitet, men for øyeblikket er den mye mindre utbredt enn MP3.

    WMA - se ovenfor.

    Data-grafikk

Dette området av multimedieteknologi er ment å formidle visuelle bilder til brukeren. Først datamaskiner hadde ikke egne verktøy for å jobbe med grafikk, men ble allerede brukt til å skaffe og behandle bilder. Datagrafikk opplevde betydelig fremgang med bruken av muligheten til å lagre bilder og vise dem på en dataskjerm.

Etter bildekonstruksjonsmetoder data-grafikk kan deles inn i todimensjonal og tredimensjonal grafikk. Todimensjonal datagrafikk (2D) klassifiseres i henhold til typen presentasjon av grafisk informasjon og de resulterende bildebehandlingsalgoritmene. Følgende typer 2D-grafikk er kjent:

    Raster-grafikk. Denne typen todimensjonal grafikk opererer alltid på en todimensjonal matrise (matrise) av piksler. Pixel er den minste enheten punktgrafikk, som er en udelelig gjenstand av en rektangulær (vanligvis firkantet) form med en bestemt farge. Uten betydelig tap av visuell kvalitet kan rasterbilder bare reduseres; En økning i rasterbilder fører til en økning i diskretheten til bildet (se fig. 1). Ethvert bilde kan representeres i rasterform, men denne lagringsmetoden er preget av en stor mengde minne som kreves for å jobbe med bilder og tap under redigering.

Fig.3.1. Resultatet av å forstørre et rasterbilde.

    Vektorgrafikk. Representerer et bilde som et sett med primitiver, som vanligvis er punkter, linjer, sirkler, rektangler, samt splines av en eller annen rekkefølge. Objekter tildeles visse attributter (linjetykkelse, fyllfarge osv.). Tegningen er lagret som et sett med koordinater, vektorer og andre numeriske verdier som karakteriserer et sett med primitiver. Et bilde i vektorformat gir mulighet for redigering, siden det kan skaleres, roteres og deformeres uten tap (i motsetning til et rasterbilde). Samtidig kan ikke alle bilder representeres som et sett med primitiver. Denne presentasjonsmetoden er bra for diagrammer, brukes til skalerbare fonter, forretningsgrafikk, og er veldig mye brukt for å lage tegneserier og ganske enkelt videoer med forskjellig innhold.

    Fraktal grafikk. I generell forstand er en fraktal et objekt hvis individuelle elementer arver egenskapene til overordnede strukturer. Siden en mer detaljert beskrivelse av elementer i mindre skala skjer ved hjelp av en enkel algoritme, kan et slikt objekt beskrives med bare noen få matematiske ligninger.

Tredimensjonal datagrafikk opererer med objekter i tredimensjonalt rom. Vanligvis er resultatene av å visualisere en tredimensjonal graf et flatt bilde, en projeksjon. I 3D-grafikk alle objekter er vanligvis representert som en samling av overflater eller partikler. Den minimale overflaten kalles en polygon. Trekanter er oftest valgt som polygoner.

For å overføre og lagre farger i datagrafikk, brukes ulike former for representasjon. Generelt er farge et sett med tall, koordinater i et fargesystem. For eksempel er følgende fargegjengivelsesmodeller kjent:

    RGB (en forkortelse av de engelske ordene Red, Green, Blue - red, green, blue) er en additiv fargemodell: farger oppnås ved å legge til svart. Med andre ord, hvis fargen på en skjerm opplyst av en fargespotlight er angitt som (r 1, g 1, b 1), og fargen på den samme skjermen som er opplyst av en annen spotlight er (r 2, g 2, b 2 ), så når den blir opplyst av disse to med spotlights, vil skjermfargen bli utpekt som (r 1 + r 2, g 1 + g 2, b 1 + b 2). Valget av primærfarger bestemmes av fysiologien til fargeoppfatning av netthinnen i det menneskelige øyet. RGB-fargemodellen er mye brukt i teknologi. TV-er og monitorer bruker tre elektronkanoner (eller tre typer lysdioder, lysfiltre osv.) for de røde, grønne og blå kanalene.

    CMYK (fra engelske Cyan, Magenta, Yellow, Color - cyan, magenta, gul, farge) er et subtraktivt fargeformasjonsskjema, vanligvis brukt i utskrift for standard prosessutskrift.

    HSV (fra engelske Hue, Saturation, Value - tone, saturation, value) er en fargemodell der koordinatene er fargetone, metning (også kalt fargerenhet) og fargeverdi (lysstyrke). Denne modellen er en ikke-lineær transformasjon av RGB-modellen.

Datagrafikk representerer et av de kraftigste områdene i utviklingen av datateknologi.

    Video

Video (fra den latinske videoen - "Jeg ser på", "Jeg ser") - dette begrepet refererer til et bredt spekter av teknologier for opptak, prosessering, overføring, lagring og avspilling av visuelt og audiovisuelt materiale på skjermer.

De viktigste egenskapene til et videosignal er antall bilder per sekund, skannehastighet, oppløsning, sideforhold, fargeoppløsning, videostrømbredde og kvalitet. La oss se på disse egenskapene separat.

Antall bilder per sekund (frekvens) er antall stillbilder som erstatter hverandre når man viser 1 sekund med videomateriale og skaper effekten av bevegelse på skjermen. Jo høyere bildefrekvens, jo jevnere og mer naturlig vil bevegelsen se ut. Minimumsindikatoren der bevegelsen vil bli oppfattet som uniform er omtrent 10 bilder per sekund (denne verdien er individuell for hver person). Digitaliserte videoopptak av god kvalitet bruker vanligvis en bildefrekvens på 30 bilder per sekund.

Skanning av videomateriale kan være progressiv (progressiv) eller interlaced (interlacing). Med progressiv skanning vises alle horisontale linjer (linjer) i bildet samtidig, med interlaced skanning vises partall og oddetall linjer vekselvis. Interlace-skanning ble oppfunnet for å vise bilder på bilderør og brukes nå til å overføre video gjennom "smale" kanaler som ikke tillater at bildet overføres i full kvalitet.

Ethvert videosignal er preget av vertikal og horisontal oppløsning, målt i piksler. Typisk analog TV-oppløsning er 720x576 piksler. Den nye standarden for høyoppløselig digital TV HDTV tilbyr oppløsninger på opptil 1920x1080 med progressiv skanning.

Forholdet mellom rammebredde og høyde er den viktigste parameteren i ethvert videomateriale. Den gamle standarden, som foreskriver et sideforhold på 4:3, som dukket opp tilbake i 1910, erstattes av 16:9-standarden, som er mer forenlig med det naturlige synsfeltet til en person, som nå er standarden for digital-TV.

Antall farger og fargeoppløsning til et videosignal er beskrevet av fargemodellene som er diskutert tidligere. I datateknologi hovedsakelig brukt RGB HSV.

Bredden på videostrømmen eller bithastigheten (fra engelsk Bitrate - bitfrekvens) er antall behandlede biter med videoinformasjon per sekund av tiden. Jo høyere videostrømbredden er, desto bedre er videokvaliteten generelt. For eksempel, for VideoCD-formatet er bithastigheten bare ca. 1 Mbit/s, for DVD - ca. 5 Mbit/s, og for HDTV-formatet - ca. 10 Mbit/s.

Videokvalitet måles ved hjelp av formelle beregninger som PSNR eller SSIM, eller ved bruk av subjektive sammenligninger med eksperter.

Blant de moderne standardene for digital koding og komprimering av videomateriale, kan følgende skilles:

    MPEG-2 er en gruppe standarder for digital koding av video- og lydsignaler. MPEG-2 brukes først og fremst til video- og lydkoding i kringkasting, inkludert satellittkringkasting og kabel-TV. Med noen modifikasjoner brukes dette formatet også som standard for DVD-komprimering.

    MPEG-4 er en ny internasjonal standard for digital video- og lydkomprimering, som dukket opp i 1998. Brukes til kringkasting ( strømme video), filmplateopptak, videotelefoni og kringkasting. Inkluderer mange funksjoner i MPEG-2 og andre standarder, og legger til funksjoner som støtte for virtuelt markeringsspråk VRML for visning av 3D-objekter, objektorienterte filer, støtte for rettighetsadministrasjon og ulike typer interaktive medier.

    Ogg Theora er en videokodek utviklet av Xiph.Org Foundation som en del av deres "Ogg"-prosjekt (målet med dette prosjektet er å integrere On2 VP3-videokodeken, Ogg Vorbis-lydkodeken og Ogg-mediebeholderen i én MPEG -4-lignende multimedialøsning). Et helt åpent, lisensfritt multimedieformat.

For tiden er multimedieteknologier et raskt utviklende område innen informasjonsteknologi. Et betydelig antall store og små firmaer, tekniske universiteter og studioer (spesielt IBM, Apple, Motorola, Philips, Sony, Intel, etc.) jobber aktivt i denne retningen. Bruksområdene er ekstremt mangfoldige: interaktive opplærings- og informasjonssystemer, CAD, underholdning, etc.

De viktigste karakteristiske egenskapene til disse teknologiene er:

Kombinere et multi-komponent informasjonsmiljø (tekst, lyd, grafikk, bilder, video) i en homogen digital representasjon;

Sikre pålitelig (ingen forvrengning ved kopiering) og varig lagring (garantert lagringsperiode er titalls år) av store mengder informasjon;

Enkel informasjonsbehandling (fra rutine til kreative operasjoner).

Det oppnådde teknologiske grunnlaget er basert på bruken av den nye optiske mediestandarden DVD (Digital Versalite/Video Disk), som har en kapasitet i størrelsesorden flere og titalls gigabyte og erstatter alle tidligere: CD-ROM, Video-CD , CD-lyd. Bruken av DVD gjorde det mulig å realisere konseptet digital informasjonshomogenitet. Én enhet erstatter en lydspiller, videoopptaker, CD-ROM, diskstasjon osv. Når det gjelder informasjonspresentasjon, bringer den optiske medie-DVDen den nærmere nivået av virtuell virkelighet.

Det er tilrådelig å dele multi-komponent multimediemiljøet inn i tre grupper: lyd, video, tekstinformasjon.

Lydsekvens kan inkludere tale, musikk, effekter (lyder som støy, torden, knirking osv., forenet med betegnelsen WAVE). Hovedproblemet ved bruk av denne multimediegruppen er informasjonskapasitet. For å ta opp ett minutt med WAVE-lyd av topp kvalitet, trenger du omtrent 10 MB minne. For å løse dette problemet, brukesder.

Videosekvens Sammenlignet med lyd er den preget av et stort antall elementer. Det er statiske og dynamiske videosekvenser.

Statisk videosekvens inkluderer grafikk (tegninger, interiør, overflater, symboler i grafisk modus) og fotografisk informasjon (bilder og skannede bilder).

Dynamisk videosekvens er en sekvens av statiske elementer (rammer). Tre typiske grupper kan skilles:

Vanlig video (livsvideo) – en sekvens av fotografier (24 bilder per sekund);

Kvasi-video – en sparsom sekvens av fotografier (6–12 bilder per sekund);

Animasjon er en sekvens av håndtegnede bilder.

Det første problemet ved implementering av videosekvenser er skjermoppløsning og antall farger. Det er tre retninger:

VGA-standarden gir en oppløsning på 640´480 piksler (punkter) på skjermen med 16 farger eller 320´200 piksler med 256 farger;

SVGA-standarden (512 KB videominne, 8 bits/piksel) gir en oppløsning på 640´480 piksler med 256 farger;

24-bits videoadaptere (2 MB videominne, 24 bits/piksel) tillater bruk av 16 millioner farger.

Det andre problemet er mengden minne. For statiske bilder krever én fullskjerm følgende minnemengder:

I 640´480-modus, 16 farger – 150 KB;

I 320´200-modus, 256 farger – 62,5 KB;

I 640´480-modus, 256 farger – 300 KB.

Slike betydelige volumer i implementeringen av lyd- og videosekvenser bestemmer høye krav til informasjonsbæreren, videominnet og informasjonsoverføringshastigheten.