Walang authora priekšvārda
1. nodaļa. Ievads
1.1. Daudzfaktoru normālais sadalījums kā modelis
1.2. Vispārīgs daudzfaktoru metožu pārskats
Panitikan
2. nodaļa. Daudzfaktoru normālais sadalījums
2.1. Ievads
2.2. Ar daudzfaktoru sadalījumiem saistītie jēdzieni
2.3. Daudzfaktoru normālais sadalījums
2.4. Normāli sadalītu vērtību lineāras kombinācijas sadalījums; daudzumu neatkarība; privātās izplatīšanas
2.5. Nosacītie sadalījumi un daudzkārtējās korelācijas koeficients
2.6. Raksturīga funkcija; mirkļi
Panitikan
Uzdevumi
3. nodaļa: Vidējā vectora un kovariācijas matricas novērtēšana
3.1. Ievads
3.2. Vidējā vektora un kovariācijas matricas maksimālās varbūtības aplēses
3.3. Izlases vidējā vektora sadalījums; secinājums par vidējo, kad ir zināma kovariācijas matrica
Panitikan
Uzdevumi
4. nodaļa: Izlases korelācijas koeficientu sadalījums un izmantošana
4.1. Ievads
4.2. Divfaktoru izlases korelācijas koeficients
4.3. Daļējās korelācijas koeficienti
4.4. Daudzkārtējs korelācijas koeficients
Panitikan
Uzdevumi
5. nodaļa. Vispārējā T2 istatistika
5.1. Ievads
5.2. Vispārināta T2 statistika un to sadalījums
5.3. T2 istatistika pielietojumi
5.4. T2 statistikas sadalījums konkurējošu hipotēžu klātbūtnē; jaudas funkcija
5.5. Dažas T2 kritērija optimālās īpašības
5.6. Daudzdimensionāla Bērensa-Fišera problema
Panitikan
Uzdevumi
6. nodaļa. Novērojumu klasifikācija
6.1. Klasipikasyon ng problema
6.2. Pareizas klasifikācijas principi
6.3. Mga pamamaraan ng novērojumu klasificēšanai divu populaciju gadījumā at zināmu varbūtības sadalījumu
6.4. Novērojumu klasifikācija divu populaciju gadījumā at zināmiem daudzfaktoru normālajiem sadalījumiem
6.5. Novērojumu klasifikācija divu daudzfaktoru normālo populaciju gadījumā, kuru parametri tiek novērtēti no izlases
6.6. Novērojumu klasifikācija vairāku vispārīgu populaciju gadījumā
6.7. Novērojumu klasifikācija vairāku daudzfaktoru normālo populaciju gadījumā
6.8. KlasIFIkācijas piemērs vairāku daudzfaktoru normālu populaciju gadījumā
Panitikan
Uzdevumi
7. nodaļa. Izlases kovariācijas matricas un izlases vispārinātās dispersijas sadalījums
7.1. Ievads
7.2. Izplatīšana si Wishart
7.3. Dažas Wishart izplatīšanas īpašības
7.4. Kohrena teorēma
7.5. Ģeneralizēta dispersija
7.6. Korelācijas koeficientu kopas sadalījums diagonālās populacijas kovariācijas matricas gadījumā
Panitikan
Uzdevumi
8. nodaļa. Vispārējo lineāro hipotēžu pārbaude. Dispersias analīze
8.1. Ievads
8.2. Daudzfaktoru lineārās regresijas parametru aplēses
8.3. Iespējamības koeficientu testi lineāro hipotēžu pārbaudei par regresijas koeficientiem
8.4. Iespējamības koeficienta momenti gadījumā, ja nulles hipotēze ir patiesa
8.5. Daži U vērtību sadalījumi
8.6. Asimptotiskā varbūtības koeficienta sadalījuma izplešanās
8.7. Hipotēžu parbaude par regresijas koeficientu matricām un ticamības reģioniem
8.8. Parbaudīt hipotēzi par normālo sadalījumu vidējo vērtību vienādību at vispārējo kovariācijas matricu
8.9. Vispārināta ANOVA
8.10. Citi lineārās hipotēzes pārbaudes kritēriji
8.11. Kanoniskā form
Panitikan
Uzdevumi
9. nodaļa. Hipotēzes par gadījuma lielumu kopu neatkarību pārbaude
9.1. Ievads
9.2. Varbūtības koeficients kā kritērijs, lai pārbaudītu hipotēzi par nejaušo mainīgo kopu neatkarību
9.3. Iespējamības koeficienta momenti ar nosacījumu, nulles hipotēze ir patiesa
9.4. Daži varbūtības koeficientu sadalījumi
9.5. Asimptotiska h sadalījuma izplešanās (iespējamības koeficienti)
9.6. Piemers
9.7. Divu gadījuma lielumu kopu gadījums
Panitikan
Uzdevumi
10. nodaļa. Hipotēžu parbaude par kovariācijas matricu vienādību un gan vidējo vektoru, gan kovariācijas matricu vienādību
10.1. Ievads
10.2. Kritēriji hipotēžu pārbaudei par vairāku kovariācijas matricu vienādību
10.3. Vairāku normālu populaciju līdzvērtības hipotēzes pārbaudes kritēriji
10.4. Varbūtības koeficienta momenti
10.5. Lielumu V1 at V sadalījuma funkciju asimptotiskie izvērsumi
10.6. Divu populaciju gadījums
10.7. Pārbaudot hipotēzi, ka kovariācijas matrica ir proporcionāla noteiktai matricai. Sfēriskuma kritērijs
10.8. Pārbaudot hipotēzi, ka kovariācijas matrica ir vienāda ar doto matricu
10.9. Pārbaudot hipotēzi, maaari mong makita ang mga vektor ng kovariācijas matrica at attiecīgi vienāda at doto vectoru at doto matricu
Panitikan
Uzdevumi
11. nodaļa. Galvenās sastāvdaļas
11.1. Ievads
11.2. Populācijas galveno componenttu noteikšana
11.3. Galveno componenttu un to dispersiju maksimālās varbūtības aplēses
11.4. Galveno komponentu maksimālās iespējamības aprēķinu aprēķināšana
11.5. Piemers
Panitikan
Uzdevumi
12. nodaļa. Kanoniskās korelācijas un kanoniskie lielumi
12.1. Ievads
12.2. Kanoniskās korelācijas un kanoniskie populacijas daudzumi
12.3. Kanonisko korelāciju un kanonisko lielumu novērtēšana
12.4. Aprēķina na pamamaraan
12.5. Piemers
Panitikan
Uzdevumi
13. nodaļa. Dažu raksturīgo sakņu un vectoru sadalījums neatkarīgi no parametriem
13.1. Ievads
13.2. Divu Visharta matricu gadījums
13.3. Vienas nevienskaitļa Visharta matricas gadījums
13.4. Kanoniskās korelācijas
Panitikan
Uzdevumi
14. nodaļa. Dažu citu darbu apskats par daudzfaktoru analīzi
14.1. Ievads
14.2. Hipotēžu parbaude par rangu un regresijas koeficientu lineāro ierobežojumu novērtēšana. Kanoniskās korelācijas un kanoniskie lielumi
14.3. Necentrālā Wishart izplatīšana
14.4. Dažu raksturīgo sakņu un vectoru sadalījums atkarībā no parametriem
14.5. Dažu raksturīgu sakņu un vectoru asimptotiskais sadalījums
14.6. Galvenās sastāvdaļas
14.7. Pagsusuri ng pabrika
14.8. Stohastiskie vienādojumi
14.9. Laika rindu analīze
Panitikan
Pieteikums. Teorya ng Matricas
1. Depinisyon ng Matricu. Darbības uz matricām
2. Raksturīgās saknes un vektori
3. Vektoru un matricu sadalīšana blokos
4. Mga resulta
5. Ang mga pamamaraan ng pagbabawas ng mga pamamaraan sa pamamagitan ng sabiezināšanas pamamaraan lineāro vienādojumu sistēmu risināšanai
Panitikan
Priekšmeta rādītājs

Sociālajiem un ekonomiskajiem objektiem parasti ir raksturīgs diezgan liels parametru skaits, kas veido daudzdimensionālus vektorus, un šo vectoru komponentu attiecību izpētes uzdevumi iegūst īpašu nozīmi ekonomiskamosjo, i un sociālamos, un sociālajiem t identificēti, pamatojoties uz ierobežotu skaitu daudzdimensiju novērojumu.

Ang mga istatistika ng Daudzdimensiju ay nag-analisa ng mga istatistika ng nozare, tulad ng mga istatistika ng daudzdimensiju na mga istatistika sa mga pamamaraan ng apstrādes, sa sistematizēšanu at apstrādi, lai identificētu pētāmā daudzdimensi ju raksturlielumaluma komponentu attiecūruk gūrukstūrukstū.

Lūdzu, ņemiet vērā, ka datu vākšanas metodes var atšķirties. Tatad, ja tiek pētīta pasaules ekonomika, tad dabiski ir valstis, uz kurām tiek novērotas vektora X vērtības, bet, ja tiek pētīta valsts ekonomika. sistemang pang-ekonomiya, tad ir dabiski novērot vectora X vērtības vienā un tajā pašā valstī (interesē pētnieku) dažādos laika punktos.

Mga pamamaraan ng istatistika para sa mga istatistika ng mga kurso ng mga istatistika, pag-aaral ng “Ekonometrika” at pag-aaral ng mga tradisyunal na batayan para sa mga istatistika ng mga kurso, disciplīna “Ekonometrija” at regresijas at alīzes lietišķanaitu aplūkošanait.

Šī rokasgrāmata ir veltīta citām metodēm daudzdimensiju populaciju izpētei, pamatojoties uz statistikas datiem.

Daudzdimensionālās telpas dimensijas samazināšanas metodes ļauj bez būtiskiem informācijas zudumiem pāriet no sākotnējās liela skaita novērojamu savstarpēji saistītu faktoru sistēmas uz sistēmu ar i evālērojami ma evālērojami ma āciju. oriģinālajām īpašībām. Pirmajā nodaļā ir aprakstītas komponentu un faktoru analīzes methods, ar kurām var identificēt objektīvi esošus, bet tieši nenovērojamus modeļus, izmantojot galvenos komponentus vai faktorus.

Daudzdimensiju klasifikācijas metodes ir paredzētas, lai sadalītu objektu kopas (ko raksturo liels skaits pazīmju) klasēs, no kurām katrā jāiekļauj objekti, kas noteiktā nozīmē ir viendabīgi vai līdz īgi. Šādu klasifikāciju, pamatojoties uz statistikas datiem par objektu pazīmju vērtībām, var veikt, izmantojot klasteru un discriminantu analīzes methods, as apskatītas otrajā nodaļā (Daudzfaktoru statistiskā STA anal īze”).

Datortehnoloģiju attīstība un programmatura veicina daudzfaktoru statistiskās analīzes metožu plašu ieviešanu praksē. Lietojumprogrammatūras pakotnes ar ērtu lietotāja interfeisu, halimbawa, SPSS, Statistica, SAS u.c., novērš šo metožu lietošanas grūtības, kas sastāv no matemātiskā aparāta sarežģītības, pamatojo statistik mates, pamatojo statistik mates, pamatojou statistikas, pamatojo stats un aprēķinu sarežģītība.

Taču programmu izmantošana, neizprotot izmantoto algoritmu matemātisko būtību, veicina pētnieka ilūzijas veidošanos par daudzfaktoru statistikas metožu pielietošanas vieglumu, kas var novest pie nepareiziem vai nepamatotiem result. Nozīmīgus praktiskus rezultātus var iegūt, tikai pamatojoties uz professionālajām zināšanām mācību priekšmeta jomā, ko papildina zināšanas par matemātiskajām metodēm un lietojumu pakotnēm, kurās šīsten metodes ti.

Tāpēc par katru no šajā grāmatā aplūkotajām metodēm ir sniegta pamata teorētiskā informācija, tostarp algoritmi; Tiek apspriesta šo metožu un algoritmu ieviešana lietojumprogrammu pakotnēs. Apskatāmās methods ir ilustrētas ar to piemēriem praktisks pielietojums ekonomiya, izmantojot SPSS paketi.

Rokasgrāmata ir uzrakstīta, balstoties uz kursa “Daudzfaktoru statistikas methods” pasniegšanas pieredzi studentiem Nag-unibersidad ang Valsts vadība. Lai detalizētāk izpētītu izmantotās daudzfaktoru statistiskās analīzes methods, ieteicams izmantot grāmatas.

Tiek pieņemts, ka lasītājs labi pārzina lineārās algebras (halimbawa, mācību grāmatas sējumā un mācību grāmatas pielikumā), varbūtību teorijas un matemātiskās statistikas kursus (piem ēram, mācību grāmatas sējumā).

Ang mga istatistika ng pag-aaral ng Daudzfaktoru ay nagsusuri ng mga ito, kung gayon ang mga posibleng problema:

  • * zīmju atkarības izpēte;
  • * vectoru norādīto objektu vai pazīmju klasifikācija;
  • * samazinot objekta telpas izmēru.

Šajā gadījumā novērojumu rezultāts ir fiksēta daudzuma kvantitatīvo un dažreiz kvalitatīvo raksturlielumu vērtību vektors, kas izmērīts objektā. Kvantitatīvs raksturlielums ir novērojamas vienības raksturlielums, ko var tieši izteikt ar skaitli un mērvienību. Kvantitatīvs raksturlielums tiek pretstatīts kvalitatīvajam raksturlielumam - novērotās vienības pazīme, bilang noteikta, piešķirot vienu no divām vai vairākām nosacītajām kategorijām (ja ir tieši raksturlielums). Kvalitatīvo raksturlielumu statistiskā analīze ir daļa no neskaitliskas dabas objektu statistikas. Kvantitatīvie raksturlielumi ir sadalīti raksturlielumos, kas mērīti pēc intervālu, attiecību, atšķirību un absolūtā skalas.

Un kvalitatīvi - zīmēm mērot nosaukumu skalā un kartas skala. Datu apstrādes metodēm jāatbilst skalām, kurās tiek mērīti attiecīgie raksturlielumi.

Pazīmju atkarības izpētes mērķi ir pierādīt saiknes esamību starp pazīmēm un izpētīt šo saikni. Lai pierādītu saiknes esamību starp diviem gadījuma lielumiem X un Y, tiek izmantota korelācijas analīze. Ja X un Y kop?jiem raksturlielumiem izmanto hī kvadrāta testu.

Regresijas analīze tiek izmantota, lai pētītu kvantitatīvās pazīmes Y funkcionālo atkarību no kvantitatīvajām pazīmēm x(1), x(2), ..., x(k). Šo atkarību sauc par regresiju vai, īsumā, regresiju. Vienkāršākais regresijas analīzes varbūtības modelis (ja k = 1) kā sākotnējo informāciju izmanto novērojumu rezultātu pāru kopu (xi, yi), i = 1, 2, … , n, un tam ir forma

yi = axi + b + ei, i = 1, 2, … , n,

kur ei ir novērojumu kļūdas. Dažkārt tiek pieņemts, ka ei ir neatkarīgi nejauši mainīgie ar vienādu normālo sadalījumu N(0, y2). Tā kā novērojumu kļūdu sadalījums parasti atšķiras no parastā, regresijas modeli ieteicams ņemt vērā neparametriskā formulējumā, t.i. ar patvaļīgu ei sadalījumu.

Regresijas analīzes galvenais uzdevums ir novērtēt nezināmos parametrus a un b, kas nosaka lineārā atkarība y hindi x. Šīs problēmas risināšanai tiek izmantota K. Gausa 1794. gadā izstrādātā mazāko kvadrātu metode, t.i. attrast nezināmo modeļa parametru a un b aplēses no kvadrātu summas samazināšanas nosacījuma

pēc mainīgajiem a un b.

Dispersijas analīze tiek izmantota, lai pētītu kvalitatīvo raksturlielumu ietekmi uz kvantitatīvo mainīgo. Halimbawa, lai ir k mērījumu rezultātu paraugi kvantitatīvs rādītājs uz k mašīnām ražoto produktu vienību kvalitāte, t.i. skaitļu kopa (x1(j), x2(j), … , xn(j)), kur j ir mašīnas numurs, j = 1, 2, …, k un n ir izlases lielums. Kopējā dispersijas analīzes formulējumā tiek pieņemts, ka mērījumu rezultāti ir neatkarīgi un katrā paraugā tiem ir normāls sadalījums N(m(j), y2) ar vienādu dispersiju.

Preču kvalitātes viendabīguma pārbaude, t.i. mašīnas numura ietekmes trūkums uz produkta kvalitāti ir saistīts ar hipotēzes pārbaudi

H0: m(1) = m(2) = … = m(k).

Variācijas analīze ir izstrādājusi metodes šādu hipotēžu pārbaudei.

Hipotēze H0 tiek pārbaudīta pret alternatīvo hipotēzi H1, saskaņā ar kuru nav izpildīta vismaz viena norādītajām vienādībām. Šīs hipotēzes pārbaude ir balstīta uz šādu R. A. Fišera norādīto "dispersijas sadalīšanos".

kur s2 ir izlases dispersija apvienotajā paraugā, t.i.

Tādējādi pirmais term formulas (7) labajā pusē atspoguļo grupas iekšējo izkliedi. Visbeidzot, pastāv starpgrupu dispersija,

Lietišķās statistikas jomu, bilang saistīta at dispersijas paplašinājumiem, halimbawa, formula (7), sauc par dispersijas analīzi. Kā piemēru dispersijas problēmas analīzei apsveriet iepriekšminētās hipotēzes H0 pārbaudi, pieņemot, ka mērījumu rezultāti ir neatkarīgi un katrā paraugā tiem ir normāls sadalījums N(m(j), y2) ar vi ejunādu. Ja H0 ir patiess, pirmajam vārdam formulas (7) labajā pusē, dalitam ar y2, ir hī kvadrāta sadalījums ar k(n-1) brīvības pakāpēm, un otrajam vārdam, dalitam ar y2, ir arī hī (kvadr bet sadalī k -1) brīvības pakāpēm, kur pirmais un otrais terms ir neatkarīgi kā nejauši mainīgie. Tāpēc nejaušais mainīgais

ir Fišera sadalījums ar (k-1) skaitītāja brīvības pakāpēm un k (n-1) saucēja brīvības pakāpēm. Hipotēze H0 tiek pieņemta, at F< F1-б, и отвергается в противном случае, где F1-б - квантиль порядка 1-б распределения Фишера с указанными числами степеней свободы. Такой выбор критической области определяется тем, что при Н1 величина F безгранично увеличивается при росте объема выборок n. Значения F1-б берут из соответствующих таблиц.

Klasisko dispersijas analīzes problēmu risināšanai ir izstrādātas neparametriskas methods, it īpaši hipotēzes H0 parbaudei.

Sinusuri ng mga nakamais daudzfaktoru statistiskās ang mga problēmu veids ir klasifikācijas problēmas. Principā tie ir sadalīti trīs daļās dažādi veidi- discriminantu analīze, klasteru analīze, groupēšanas problēmas.

Sinusuri ng diskriminanta ang mga uzdevums sa mga tala sa novērota na bagay na klasificēšanai kādā no iepriekš aprakstītajām klasēm. Šajā gadījumā objekti tiek aprakstīti matemātiskā modelī, izmantojot vektorus, kuru koordinātas ir rezultāts, novērojot vairākas pazīmes katrā objektā. Nodarbības ir aprakstītas vai nu tieši matemātiskā izteiksmē, vai izmantojot apmācību paraugus. Treniņu komplekts ir paraugs, kuram katram elementam ir norādīts, pie kuras klases tas pieder.

Apskatīsim piemēru, kā izmantot discriminantu analīzi lēmumu pieņemšanai tehniskajā diagnostikā. Pieņemsim, ka, pamatojoties uz vairāku produkta parametru mērīšanas rezultātiem, ir jānosaka defektu esamība vai neesamība. Šajā gadījumā apmācības parauga elementiem tiek norādīti defekti, kas atklāti papildu izpētē, halimbawa, pēc noteikta darbības perioda. Diskriminējošā analīze ļauj samazināt kontroles apjomu un arī paredzēt produktu turpmāko uzvedību. Diskriminanta analīze ir līdzīga regresijas analīzei - pirmā ļauj prognozēt kvalitatīva raksturlieluma vērtību, bet otrā - kvantitatīvā. Neskaitliskas dabas objektu statistikā ir izstrādāta matemātiskā shēma, kuras īpašie gadījumi ir regresijas un discriminantu analīzes.

Klasteru analīze tiek izmantota, ja, pamatojoties uz statistikas datiem, ir nepieciešams sadalīt izlases elementus grupās. Turklāt diviem grupas elementiem no vienas grupas jābūt “tuviem” tajos izmērīto raksturlielumu vērtību kopuma ziņā, un diviem elementiem no dažādām grupām jābūt “attāliem” tādā pašā nozīm ē. Atšķirībā no discriminantās analīzes, klasteru analīzē klases netiek precizētas, bet veidojas statistikas datu apstrādes procesā. Halimbawa, klasteru analīzi var izmantot, lai sadalītu tērauda marku (vai ledusskapju zīmolu) kopu grupās, kas ir līdzīgas viena otrai.

Cits klasteru analīzes veids ir raksturlielumu sadalīšana grupās, kas ir tuvu viena otrai. Izlases korelācijas koeficients var kalpot kā raksturlielumu līdzības rādītājs. Pazīmju kopu analīzes mērķis var būt kontrolēto parametru skaita samazināšana, kas var ievērojami samazināt kontroles izmaksas. Lai to izdarītu, no cieši saistītu raksturlielumu grupas (kurai korelācijas koeficients ir tuvu 1 - tā maksimālā vērtība) tiek mērīta viena vērtība, bet pārējo vērtības tiek aprēresijasinātas , reg izmantoālījot.

Grupēšanas problēmas tiek atrisinātas, ja klases nav iepriekš noteiktas un tām nav jāatrodas “tālu” vienai no otras. Piemērs ir studentu groupēšana mācību grupās. Tehnoloģijā grupēšanas problēmas risinājums bieži vien ir parametru rinda - iespējamie standarta izmēri tiek grupēti atbilstoši parametru sērijas elementiem. Magbasa pa

Klasifikācijas problēmas tiek risinātas ne tikai daudzfaktoru statistiskajā analīzē, bet arī tad, ja novērojumu rezultāti ir skaitļi, funkcijas vai objekti, kuriem nav skaitliskas dabas. Sinusuri ng Tādējādi daudzi klasteru ang algoritmi izmanto tikai attālumus starp objektiem. Tāpēc tos var izmantot arī neskaitliskas dabas objektu klasificēšanai, ja vien ir norādīti attālumi starp tiem. Vienkāršākais uzdevums klasifikācija ir šāda: ņemot vērā divus neatkarīgus paraugus, ir jānosaka, vai tie pārstāv divas klase vai vienu. Vienfaktoru statistikā šis uzdevums ir saistīts ar viendabīguma hipotēzes pārbaudi.

Pinag-aaralan ng Trešā daudzfaktoru statistiskās ang sadaļa ir dimensiju samazināšanas (informācijas saspiešanas) problēma. Upang tumaas sa okasyon tnējo rādītāju skaitu, bet tie saturētu pēc iespējas lielāku daļu no tajā pieejamās informācijas. oriģinālie statistikas dati. Dimensiju samazināšanas problēmas tiek risinātas, izmantojot daudzdimensiju mērogošanas metodes, galvenās sastāvdaļas, faktoru analīzi utt. Halimbawa, vienkāršākajā daudzdimensiju mērogošanas modelī sākotnējie dati ir attālumi pa pāriem starp k objektiem, un aprēķinu mērķis ir attēlot objektus kā punktus. lidmašīnā. Tas ļauj burtiski redzēt, kā objekti ir saistīti viens ar otru. Lai sasniegtu šo mērķi, ir nepieciešams katram objektam piešķirt punktu plaknē, lai pāru attālumi sij starp punktiem, atbilst objektiem ar skaitļiem i un j, pēc iespējas precīzāk atvelumi i starp otjāk atvem. Saskaņā ar mazāko kvadrātu methods pamatideju plaknes punkti tiek attrasti tā, lai vērtība

sasniedza savu mērķi zemākā vērtība. Ir daudz citu dimensiju samazināšanas un datu vizualizācijas problēmu formulējumu.

varbūtības matemātiskās statistikas kvalitāte

DAUDZVARIĀTU STATISTISKĀ ANALĪZE

Matemātikas sadaļa statistika, kas veltīta matemātikai. mga pamamaraan ng optimālu plānu veidošanai daudzfaktoru statistikas vākšanai, sistematizēšanai un apstrādei. dati, kuru mērķis ir identificēt pētāmās daudzdimensiju pazīmes komponentu attiecību raksturu un struktūru un kas paredzēti zinātnisku un praktisku datu iegūšanai. secinājumus. Ar daudzdimensionālu pazīmi saprot p-dimensiju rādītājus (zīmes, mainīgie), starp kuriem var būt: kvantitatīvi, t.i. skalāri mail noteiktā mērogā objekta pētāmās īpašības izpausmes, ordināls (vai kārtas), t.i., ļauj sakārtot. analizējamos objektus atbilstoši pētītās īpašības izpausmes pakāpei tajos; un klasifikācija (vai nominālā), t.i., dodot iespēju pētāmo objektu kopu sadalīt viendabīgās (pēc analizējamās īpašības) klasēs, kuras nevar sakārtot. Šo rādītāju mērīšanas resultāti

uz katra no pētāmās populacijas objektiem tie veido daudzdimensionālus novērojumus vai sākotnējo daudzdimensiju datu masīvu MS veikšanai. A. Ievērojama daļa M. s. A. kalpo situ? Šajā gadījumā sākotnējo statistikas datu apstrādes metožu izvēle. dati un to īpašību analīze tiek veikta, pamatojoties uz noteiktiem pieņēmumiem par daudzdimensiju (kopīgā) varbūtības sadalījuma likuma būtību

Oo, walang atbilstošās vispārējās kopas. Šīs apakšiedaļas galvenie mērķi ir: statistika. pētāmo daudzdimensiju sadalījumu, to galveno skaitlisko raksturlielumu un parametru novērtējums; izmantoto statistikas datu īpašību izpēte. pakāpes; iespējamības sadalījumu izpēte virknei statistikas datu, ar kuras palīdzību tiek veidota statistika. kritēriji dažādu hipotēžu pārbaudei par analizēto daudzdimensiju datu varbūtības raksturu. Galvenie rezultāti attiecas uz īpašo gadījumu, kad pētāmais raksturlielums ir pakļauts daudzdimensionālam normālā sadalījuma likumam, kura blīvuma funkciju nosaka sakarība

kur ir vektora matemātika. mga bahagi ng gaidu nejaušais mainīgais, t.i. ir kinakailangan ā, bet attiecībā uz apakštelpu ar zemāku dimensiju, kurā tas izrādās concentrēts pētāmais nejaušības vektors).

Tādējādi, ja (1) ir neatkarīgu novērojumu secība, kas veido nejaušu izlasi, tad parametru maksimālās varbūtības aplēses, kas piedalās (2), ir attiecīgi statistika (sk., )

un nejaušais vektors pakļaujas p-dimensijas normāllikumam un nav atkarīgs no, un matricas elementu kopīgo sadalījumu apraksta t.s. Wisha rajona izplatība (sk.), to-rogo

Iyon lang ang -Viesnīcu statistika (sk.). Jo īpaši (sk.), ja mēs definējam aprēķinu, kas koriģēts “neobjektivitātes dēļ”, kā izlases kovariācijas matricu, proti:

tad nejaušais mainīgais mēdz kad, un nejaušie mainīgie

ievērot F sadalījumu ar brīvības pakāpju skaitļiem, attiecīgi (p, p-p) un (p, n 1 + n 2-p-1). Proporcionali (7) n 1 un n 2 — divu neatkarīgu 1. tipa paraugu tilpumi, kas iegūti no vienas un tās pašas vispārējās kopas — 3. un 4.–5. tipa aplēses, kas veidotas no i-tā parauga, un

Kopējā izlases kovariācija, kas veidota no alēsēm un

Ang mga istatistika ng Daudzdimensiju ay pinag-aaralan sa pamamagitan ng pag-aaral ng mga struktūru starp pētāmās daudzdimensiju pazīmes componenttiem apvieno jēdzienus un rezultātus, at kalpo šādām MS metodēm un modeļiem. a., kā daudzkārtējs, daudzdimensionāls dispersijas analīze Un kovariācijas analīze, factoru analīze un galveno componenttu analīze, kanoniskā analīze. korelācijas. Rezultātus, kas veido šīs apakšnodaļas saturu, var iedalīt divos galvenajos veidos.

1) Labāko (zināmā nozīmē) istatistika datu konstruēšana. minēto modeļu parametru aplēses un to īpašību analīze (precizitāte, un varbūtības formulējumā - to sadalījuma likumi, ticamības apgabali utt.). Tātad pētāmo daudzdimensiju pazīmi interpretēsim kā nejaušu vektoru, kas pakļauts p-dimensiju normālajam sadalījumam un sadalām divos apakšvektoros - attiecīgi kolonnās un dimensijās q un p-q. Tas matemātiski nosaka atbilstošo vectora dalijumu. gaidas, teorētiskās un izlases kovariācijas matricas, proti:

Tad (sk. , ) apakšvektors (ar nosacījumu, ka otrais apakšvektors ir ieguvis fiksētu vērtību) arī būs normāls). Šajā gadījumā tiek aprēķināta maksimālā iespējamība. šī klasiskā daudzfaktoru daudzkārtējās regresijas modeļa regresijas koeficientu un kovariātu matricām

attiecīgi būs savstarpēji neatkarīga statistika

šeit novērtējuma sadale ir pakļauta parastajam likumam , un novērtējumi n - Visharta likums ar parametriem un (kovariācijas matricas elementi ir izteikti matricas elementu izteiksmē).

Galvenie rezultāti par parametru aplēšu konstruēšanu un to īpašību izpēti faktoru analīzes modeļos, galveno componenttu un kanonisko korelāciju modeļos ir saistīti ar dažādu paraugu kovariācijas matricu īpašvērt ībutis anališpaībasī varbītis ib

Shemās, kas neietilpst klasiskajā ietvarā. parastā modeļa un it īpaši jebkura varbūtības modeļa ietvaros galvenie rezultāti ir saistīti ar algoritmu konstruēšanu (un to īpašību izpēti), lai aprēķinātu parametru aplēses, kas ir vislabākļti funny note. modeļa kvalitāte (vai atbilstība).

2) Mga istatistika ng mga datos ng konstruēšana. kritēriji dažādu hipotēžu pārbaudei par pētāmo attiecību struktūru. Daudzfaktoru normālā modeļa ietvaros (1. tipa novērojumu secības tiek interpretētas kā nejaušas izlases no atbilstošām daudzfaktoru normālām populacijām), halimbawa, statistiskās kritērijus šādu hipot ēžu parbaudei.

I. Hipotēzes par matemātikas vectora vienādību. pētāmo rādītāju cerības uz noteiktu konkrētu vektoru; pārbaudīts, izmantojot viesnīcu statistiku at aizstāšanu ar formula (6)

II. Matemātiskās hipotēzes par vectoru vienādību. gaidas divās populācijās (ar identiskām, bet nezināmām kovariācijas matricām), kuras attēlo divas izlases; pārbaudīts, izmantojot statistiku (sk.).

III. Matemātiskās hipotēzes par vectoru vienādību. gaidas vairākās vispārējās populacijās (ar identiskām, bet nezināmām kovariācijas matricām), kuras attēlo to paraugi; pārbaudīts, izmantojot istatistika

griezumā ir i-tā p-dimensija novērojums izlases lielumā, kas pārstāv j. Generalis populācija, un ir formas (3) aprēķini, kas veidoti attiecīgi katram paraugam un apvienotajam tilpuma paraugam.

IV. Izmantojot statistiku, tiek pārbaudītas hipotēzes par vairāku normālu populaciju līdzvērtību, ko pārstāv to paraugi

griezumā - (4) tipa novērtējums, kas veidots atsevišķi no novērojumiem j- paraugi, j=1, 2, ... , k.

V. Izmantojot statistiku, tiek pārbaudītas hipotēzes par apakšvektoru-dimensiju kolonnu savstarpējo neatkarību.

kurā un ir parauga kovariācijas matricas formā (4) visam vectoram at tā apakšvektoram x i) attiecīgi.

Pētītā daudzdimensiju novērojumu kopas ģeometriskās struktūras daudzdimensiju statistiskā analīze apvieno tādu modeļu un shēmu jēdzienus un rezultātus kā pagsusuri ng diskriminacijas, varbūtību sadalījumu maisījumi, klasteru analīze un taksonomija, daudzdimensiju mērogošana. Galvenais jēdziens visās šajās shēmās ir attāluma (tuvuma mēri, līdzības mēri) jēdziens starp analizētajiem elementiem. Šajā gadījumā tos var analizēt kā reālus objektus, uz kuriem katram tiek reģistrētas rādītāju vērtības - pēc tam ģeometriskas. i-tā apskatāmā objekta attēls būs punkts attiecīgajā p-dimensiju telpā, bet paši rādītāji - tad ģeometriski. l-tā indikatora attēls būs punkts attiecīgajā n-dimensiju telpā.

Sinusuri ng Diskriminantu ang mga metodo un rezultāti (sk. , , ) ir vērsti uz šādu uzdevumu. Ir zināms, ka pastāv noteikts skaits populaciju, un pētniekam ir viens paraugs no katras populācijas (“apmācības paraugi”). Nepieciešams, pamatojoties uz pieejamajiem apmācības paraugiem, izveidot savā ziņā labāko klasifikācijas noteikumu, kas ļauj piešķirt noteiktu jaunu elementu (novērojumu) tās kopējai situ populācijai i. kurai populacijai šis elemento pieder. Parasti klasifikācijas noteikums tiek saprasts kā darbību secība: aprēķinot pētāmo rādītāju skalāro funkciju, pamatojoties uz griezuma vērtībām, tiek pieņemts lēmums piešķirt elementu discijē (košķirt elementu vienai nod); sakārtojot pašus rādītājus pēc to informācijas satura pakāpes no pareizas elementu piešķiršanas klasēm viedokļa; aprēķinot atbilstošās nepareizās klasifikācijas varbūtības.

Uzdevums analizēt varbūtības sadalījumu maisījumus (sk.) visbiežāk (bet ne vienmēr) rodas arī saistībā ar aplūkojamās populacijas “ģeometriskās struktūras” izpēti. Šajā gadījumā r-tās homogēnās klases jēdziens tiek formalizēts, izmantojot vispārējo populāciju, ko apraksta noteikts (parasti unimodāls) sadalījuma likums, lai vispārējās populācijas populācijas sadalīsta i, for apraksta noteikts (parasti unimodāls) sadalījuma likums, lai vispārējās populācijas sadalūsta tiprak i, for amu paraus sadalīek mu, sajaukums, kur p r - r -tās klase a priori varbūtība (specifiski elementi) vispārējā populacijā. Ilista ang mga istatistika ng "laba". novērtējot (walang izlases) nezināmus parametrus un dažreiz Uz. Tas jo īpaši ļauj mums reducēt elementu klasificēšanas uzdevumu uz discriminējošas analīzes shēmu, lai gan šajā gadījumā nebija mācību paraugu.

Klasteru analīzes methods un rezultāti (klasifikācija, taksonomija, “nepārraudzīta” modeļu atpazīšana, sk. , , ) ir vērsti uz šādas problēmas risināšanu. Ģeometriski analizētā elementu kopa tiek dota vai nu ar atbilstošo punktu koordinātām (t.i., matrica ..., n) , vai ģeometrisko hanggang īpašības relatīvā pozīcija, halimbawa, paru attālumu matrica. Izpētītā elementu kopa ir jāsadala salīdzinoši mazās (iepriekš zināmās vai ne) klasēs tā, lai vienas klases elementi atrastos nelielā attālumā viens no otra, savukārt dažādas klase ja iespējams, būtu pietiekami attālināti viens no otra un netiktu sadalīti daļās, kas atrodas vienlīdz tālu viena no otras.

Oo skaits tā, lai elementu pāru savstarpējo attālumu struktūra, kas mērīta , izmantojot šīs palīgkoordinātas, vidēji vismazāk atšķirtos no dotās. Jāatzīmē, ka galvenie klasteru analīzes un daudzdimensiju mērogošanas rezultāti un metodes parasti tiek izstrādātas bez jebkādiem pieņēmumiem par avota datu varbūtības raksturu.

Sinusuri ng istatistika ng Daudzfaktoru ang izmantotais mērķis galvenokārt ir risināt šādas tris problēmas.

Pag-aralan ang mga istatistika at mga istatistika ng mga problema. Pieņemot, ka pētītā statistiski reģistrēto rādītāju kopa x ir sadalīta, pamatojoties uz šo rādītāju jēgpilno nozīmi un pētījuma gala mērķiem, prognozējamo (atkarīgo) mainīgo q apakāšve dimensidad (atkarīgo). prognozējošiem (neatkarīgiem) mainīgajiem, mēs varam teikt, ka problēma ir, pamatojoties uz paraugu (1), noteikt šādu q-dimensiju vektora funkciju no pieļaujamo risinājumu klase F, mala noteiktā nozīmē sniegtu vislabāko rādītāju apakšvektora uzvedības tuvinājumu. Atkarībā no konkrētā funkcionālā veida, aproksimācijas kvalitāte un analizējamo rādītāju raksturs nonāk vienā vai citā daudzkārtējās regresijas, dispersijas, kovariācijas vai saplūšanas analīzes shēmā.

elemento at viendabīgo. noteikta jēga, grupo. Atkarībā no aprioriskās informācijas rakstura un specifiskā funkcionālā veida, kas nosaka klasifikācijas kvalitātes kritēriju, nonāk pie vienas vai otras discriminantu analīzes, klasteru analīzes (taksonomijas, “nepārra”ļudalīudalī modem saļudzītasī šanas shēmas. .

Pētāmās factoru telpas dimensijas samazināšanas un informatīvāko rādītāju atlases problēma ir noteikt tādu relatīvi neliela rādītāju kopu, kas atrodama sākotnējo rādītāju pieļauja mo transformāciju klasē. uz kuriem tiek sasniegts m-dimensiju pazīmju sistēmas informācijas satura exogēni dotā s mail augšējais noteiktais bars (sk.). Funkcijas norādīšana, kas nosaka autoinformativitātes mēru (t.i., kuras mērķis ir maksimāli palielināt statistikas masīvā (1) esošās informācijas saglabāšanu attiecībā pret pašām sākot nējām pazīdīmē na faktor mam un principiem. komponentiem, līdz pazīmju ekstrēmas grupēšanas metodēm. Funkcijas, dahil sa impormasyon tungkol sa isa sa mga halimbawa, t.i., kuru mērķis ir iegūt no (1) maksimālu informāciju par dažām citām, sa navši ietvertas rādītājos vai parādībās, noved pie mga pamamaraan ng dažādas impormasyon tungkol sa petsa atlase ng mga istatistika. atkarības izpēte un discriminantu analīze.

MS matemātiskie pamatriki. a. inversija; matricu diagonalizācijas procedūras utt.) un noteikti optimizācijas algoritmi (metodes) koordinātu nolaišanās, konjugācijas gradienti, atzarojums un saistība, dažādas nejaušās meklēšāskās un version.

Lit.: Andersons T., Ievads daudzfaktoru statistiskajā analīzē, trans. walang angļu val., M., 1963; Kendall M.J., Stewart A., Daudzfaktoru statistics analīze un laika rindas, trans. walang angļu val., M., 1976; Boļševs L.N., "Bull. Int. Stat. Inst.", 1969, Nr. 43, lpp. 425-41; Wishart .J., "Biometrika", 1928, v. 20A, 1. lpp. 32-52: Hotelling H., "Ann. Math. Stat.", 1931, v. 2. lpp. 360-78; [c] Kruskal J. V., "Psychometrika", 1964, v. 29. lpp. 1-27; Ayvazyan S. A., Bezhaeva Z. I., . Staroverovs O.V., Daudzdimensiju novērojumu klasifikācija, M., 1974.

S.A. Ayvazyan.


Matemātiskā enciklopēdija. - M.: Padomju enciklopēdija. I. M. Vinogradovs. 1977-1985.

Tehniskā tulkotāja rokasgrāmata

Matemātiskās statistikas sadaļa (sk.), kas veltīta matemātikai. pamamaraan, kuru mērķis ir identificēt attiecību raksturu un struktūru starp pētāmās daudzdimensionālās pazīmes komponentiem (sk.) un kuru mērķis ir iegūt zinātnisku. un praktiski......

Plašā nozīmē matemātiskās statistikas sadaļa (Skat. Matemātiskā statistika), kurā apvienotas metodes statistikas datu izpētei, saistīti ar objektiem, kuriem raksturīgi vairāki kvalitatīvi vai kvantitatī vi... ... Lielā padomju enciklopēdija

DAUDZVARIĀTU STATISTISKĀ ANALĪZE- matemātiskās statistikas sadaļa, kas paredzēta, lai analizētu attiecības starp trim vairākiem mainīgajiem. Nosacīti varam izdalīt trīs galvenās A.M.S. mga problema. Šis ir pētījums par attiecību struktūru starp mainīgajiem un telpas dimensijas samazināšanu... Sosyolohiya: enciklopēdija

KOVARIANCES ANALĪZE- – matemātisko metožu kopums. statistika, sa pamamagitan ng saistīta ar noteikta gadījuma lieluma Y vidējās vērtības atkarības modeļu analīzi no nekvantitatīvo faktoru kopas F un vienlaikus no kvantitatīvo faktoru kopas X. Attiecībā uz Y... . .. Krievu socioloģiskā enciklopēdija

Matemātikas sadaļa statistika, kuras saturs ir statistikas izstrāde un izpēte. mga pamamaraan ng discriminācijas problēmas risināšanai: pamatojoties uz novērojumu rezultātiem, nosakiet, kurš no vairākiem iespējamiem... ... Matemātiskā enciklopēdija, Orlova Irina Vladlenovna, Kontsevaya Natalya Valerievna, Turundaevsky Viktor Borisovich. Grāmata ir veltīta daudzfaktoru statistiskajai analīzei (MSA) at aprēķinu organizēšanai, izmantojot MSA. Lai ieviestu daudzfaktoru statistikas methods, tiek izmantota statistikas apstrādes programma...


Macību grāmata tika izveidota, pamatojoties uz autores pieredzi, pasniedzot daudzfaktoru statistiskās analīzes un ekonometrijas kursus. Satur materiālus par discriminantu, factoru, regresijas analīzi, korespondences analīzi un laikrindu teoriju. Tiek prezentētas pieejas daudzdimensiju mērogošanas problēmām un dažām citām daudzdimensiju statistikas problēmām.

Grupēšana un cenzēšana.
Uzdevumu izveidot izlases datu grupas tā, lai grupētie dati varētu sniegt gandrīz tādu pašu informācijas apjomu lēmumu pieņemšanai, cik izlase pirms grupēšanas, vispirms risina pētnieks. Grupēšanas mērķi, kā likums, ir samazināt informācijas apjomu, vienkāršot aprēķinus un padarīt datus skaidrākus. Daži statistikas testi sākotnēji ir paredzēti darbam ar grupētu paraugu. Atsevišķos aspektos grupēšanas problēma ir ļoti līdzīga klasifikācijas problēmai, kas sīkāk tiks aplūkota turpmāk. Vienlaikus ar grupēšanas uzdevumu pētnieks risina arī izlases cenzūras problēmu, t.i. krasi novirzītu datu izslēgšana no tā, kas parasti ir rupju novērojumu kļūdu rezultāts. Protams, pašā novērošanas procesā ir vēlams nodrošināt šādu kļūdu neesamību, taču tas ne vienmēr ir iespējams. Šajā nodaļā ir apskatītas vienkāršākās metodes divu iepriekš minēto problēmu risināšanai.

Satura rādītājs
1 Impormasyon
1.1. Pag-aralan ang un algebra
1.2. Teorya ng Varbūtību
1.3. Matematika istatistika
2 Daudzfaktoru sadalījumi
2.1. Nejaušie vectori
2.2. Neatkarība
2.3. Skaitliskie raksturlielumi
2.4. Normal sadalījums daudzfaktoru gadījumā
2.5. Teoryang Korelācijas
3 Grupēšana un cenzēšana
3.1. Viendimensjas grupēšana
3.2. Viendimensjas cenzūra
3.3. Neparedzētu gadījumu tabulas
3.3.1. Neatkarības hipotēze
3.3.2. Viendabīguma hipotēze
3.3.3. Korelācijas lauks
3.4. Daudzdimensiju grupoēšana
3.5. Daudzfaktoru cenzūra
4 Dati, kas nav skaitļi
4.1. Ievada piezīmes
4.2. Salīdzināšanas skalas
4.3. Ekspertu vērtējumi
4.4. Ekspertu group
5 bahagi ng kumpletong
5.1. Pārliecības intervāli
5.2. Pārliecības kopas
5.2.1. Mga parameter ng Daudzfaktoru
5.2.2. Daudzfaktoru izlase
5.3 Pagpaparaya
5.4. Neliels paraugs
6 Regresijas analīze
6.1. Mga problemang izklāst
6.2. Meklēt OMC
6.3. Ierobežojumi
6.4. Plana matrix
6.5. Pagtataya ng istatistika
7 Dispersias analīze
7.1. Ievada piezīmes
7.1.1 Normalitāte
7.1.2. Noviržu vienveidība
7.2 Mga salik ng Viens
7.3. Divi factori
7.4. Vispārējs gadījums
8 Dimensiju samazināšana
8.1. Kāpēc ir nepieciešama klasifikācija
8.2. Modelis un piemeri
8.2.1. Galvenās sastāvdaļas analīze
8.2.2. Ekstrēma funkciju grupēšana
8.2.3. Daudzdimensiju mērogošana
8.2.4. Ang tagapagpahiwatig ay may diskriminasyong analīzei
8.2.5. Radītāju izvēle regresijas modelī
9 Pagsusuri ng diskriminasyon
9.1 Modeļa pielietojamība
9.2. Lineārās prognozēšanas noteikums
9.3. Praktiski ieteikumi
9.4 Viens piemers
9.5 Mga klase sa Vairāk nekā divas
9.6. Diskriminācijas kvalitātes parbaude
10 mga pamamaraan ng heiristiskās
10.1. Ekstrēmā frakcija
10.1.1 Kvadrātveida parbaude
10.1.2 Moduļu kritērijs
10 2 Plejādes na pamamaraan
11 Galvenās sastāvdaļas method
11 1 Mga problema sa izklāst
112 Pamatkomponentu aprēķins
11.3. Piemers
114 Galveno componentu īpašības
11.4.1. Pašreproducējamība
11.4.2. Ģeometriskās īpašības
12 Pagsusuri ng pabrika
12.1. Mga problemang izklāst
12.1.1. Saziņa ar galvenajām sastāvdaļām
12.1.2. Risinājuma nepārprotamība
12.2. Matemātiskais modelis
12.2.1. Nosacījumi vietnē A
12.2.2. Nosacījumi uz slodzes matricas. Paraan ng Centroid
12.3. Latentie factori
12.3.1. Paraan ng Bartleta
12.3.2. Pamamaraan ng Tomsona
12.4. Piemers
13 Digitalization
13.1. Pagsusuri ng mga tugon
13.1.1. hī kvadrata attālums
13.1.2. Digitalizācija discriminantu analīzes uzdevumiem
13.2. Vairāk nekā divi mainīgie
13.2.1. Bināro datu matricas izmantošana kā atbilstības matrica
13.2.2. Maksimālās korelācijas
13.3 Izmer
13.4. Piemers
13.5 Jauktu datu gadījums
14 Daudzdimensiju mērogošana
14.1. Ievada piezīmes
14.2 Torgerson modelis
14.2.1. Stresa kritērijs
14.3. Mga algorithm ng Torgersona
14.4. Mga indibidwal atšķirības
15 Laikrindas
15.1. Vispārīgie noteikumi
15.2. Nejaušības kritēriji
15.2.1 Virsotnes un caurumi
15.2.2. Fāzes garuma sadalījums
15.2.3. Kritēriji, kuru pamatā ir rangu korelācija
15.2.4. Korelogramma
15.3. Tendency un seasonalitate
15.3.1. Mga tendensya ng Polinomu
15.3.2. Tendences pakāpes izvēle
15.3.3. Anti aliasing
15.3.4. Sezonālo izmaiņu novērtēšana
A Normal sadalījums
B Sadalījums X2
C Sadalījums ng mag-aaral
D Fišera izplatība.


Bezmaksas lejupielāde e-gramataērtā formātā skates un lasi:
Lejupielādējiet grāmatu Multivariate statistical analysis, Dronov S.V., 2003 - fileskachat.com, ātri un bez maksas lejupielādējiet.

Lejupielādēt pdf
Zemāk jūs varat iegādāties šo grāmatu par labāko cenu ar atlaidi ar piegādi visā Krievijā.