Határok a számítástechnikai idegtudományban

Ez a cikk a kutatási téma része

Az idegi folyamatok időbeli szerkezete Az agy szenzoros, motoros és kognitív funkcióinak összekapcsolása Az összes 17 cikk megtekintése

Szerkesztette
Dezhong Yao

Kínai Elektronikus Tudományi és Technológiai Egyetem, Kína

Felülvizsgálta
Hugo kereskedő

Mexikó Nemzeti Autonóm Egyetem, Mexikó

Daya S. Gupta

Camden County College, Egyesült Államok

A szerkesztő és a lektorok kapcsolatai a legfrissebbek a Loop kutatási profiljukban, és nem feltétlenül tükrözik a felülvizsgálat idején fennálló helyzetüket.

felelnek

  • Cikk letöltése
    • PDF letöltése
    • ReadCube
    • EPUB
    • XML (NLM)
    • Kiegészítő
      Anyag
  • Exportálás
    • EndNote
    • Referencia menedzser
    • Egyszerű TEXT fájl
    • BibTex
OSZD MEG

Perspektíva CIKK

  • 1 Nyelv- és megismerési osztály, Max Planck Pszicholingvisztikai Intézet, Nijmegen, Hollandia
  • 2 Mesterséges intelligencia laboratórium, Vrije Universiteit Brussel, Brüsszel, Belgium
  • 3 Kutatási Osztály, Sealcentre Pieterburen, Pieterburen, Hollandia
  • 4 Klinikai Orvostudományi Tanszék, Agyi Zenei Központ, Aarhus Egyetem, Aarhus, Dánia

Egész számarányok és zenei ritmus

Mik kis egész számarányok, és mitől különlegesek az egész arányú ritmusok? A hányados két inter-onset-intervallum (IOI) között van a két, általában szomszédos időtartam közötti felosztás. Egész szám arányok felírhatók törtrészként: 1,5 egyenlő 15/10 vagy 3/2, de például 2 nem írható fel törtként. Egy egész számarány kicsi ha az osztás eredménye kis egész számként írható elosztva egy másik kis egész számmal, pl. 2/3, de nem 23/51 (Pikovsky et al., 2003; Strogatz, 2003).

A ritmus, definíció szerint itt használva az időtartamok mintája (London, 2004, 4. o.), amelyet az események kezdeti sorrendje jellemez az idő múlásával, más szóval IOI-k sora. Az IOI-k között kis egész számarányú hallási ritmusok gyakoriak a világ zenéjében (Essens és Povel, 1985; Toussaint, 2013; Savage és mtsai, 2015). A pszichológiai és idegi kutatások szerint a kis egész számarányú ritmusok pontosabb belső ábrázolást tesznek lehetővé (Essens, 1986; Sakai et al., 1999), a deviancia detektálásának javítását (Jones és Yee, 1997; Large és Jones, 1999), a memória javítását ( Deutsch, 1986; Palmer és Krumhansl, 1990) és a reprodukció (Povel és Essens, 1985; Essens, 1986), valamint a jobb szinkronizálás (Patel és mtsai, 2005). A viselkedésbeli (Fraisse, 1982) és a neurofiziológiai tanulmányokban (Motz és mtsai, 2013) közölt, az egészhez viszonyított arányok (vagy azok harmonikusai) felé irányuló torzulások az egészek (vagy azok harmonikusai) felé tovább erősítik azt a gondolatot, hogy a kis arányok „vonzóként” működnek (Gupta és Chen, 2016). Ez az ötlet a közelmúltban támogatást kapott az iterált tanulás és szaporodás tanulmányaiból. Amikor az ember kezdetben véletlenszerűen időzített ritmikus szekvenciát reprodukál, és ezt a folyamatot kaszkád módon ismételjük meg egy vagy több egyénen belül, akkor a szekvenciát tudat alatt átformáljuk, hogy kis egész számarányokkal összefüggő IOI-kből álljon (1A. Ábra; vö. Polak et al. ., 2016; Ravignani et al., 2016, 2018; Jacoby és McDermott, 2017).

Miért hajlamosak a ritmusok (vagyis az időtartamok mintázata) kicsi egész számarányra? Miért vonzza az embereket olyan sajátos matematikai tulajdonságú ritmusok, mind az észlelésben, mind a produkcióban? Ez a tulajdonság tükrözi-e a zeneészlelés és/vagy a motoros szekvenálás sajátos furcsaságát, vagy magyarázható-e a kogníció általános-általános szempontjaival? Felfedezhetjük ezeket az alternatívákat a matematikai formalizmus révén? Itt matematikailag vizsgáljuk annak lehetőségét, hogy az emberi elfogultság a kis egész arányokhoz a skaláris várakozás és a kategorikus észlelés kombinációjával magyarázható.

Először az emberi időzítés vonatkozó klasszikus kereteinek felvázolásával kezdjük, majd összefoglaljuk a bizonyítékokat a kis-egész arány torzításának alátámasztására a ritmusérzékelésben. Ezután bemutatjuk javaslatunkat, amely matematikai formalizmuson keresztül összekapcsolja a kereteket az elfogultsággal. Konkrétan az időintervallum becslés skaláris tulajdonságára támaszkodva megfogalmazzuk a kategorikus észlelés egyszerű modelljét, amely egész arányarány-torzítást eredményezhet (1. ábra), és ezt összekapcsoljuk az idegi rezgésekkel. Befejezésül röviden átbeszéljük modellünk érdemeit és korlátait, és felvázoljuk a jövőbeni célokat.

Pszichofizikai és oszcillációs megközelítések

Két fő elméleti megközelítést javasoltak az emberi időzítés mögött álló mechanizmusok számbavételére (Wing és Kristofferson, 1973a, b; Getty, 1975; Meck, 1996; Church, 1999; Grondin, 2001, 2010; Mauk és Buonomano, 2004; Karmarkar és Buonomano, 2007; Ivry és Schlerf, 2008; Allman és mtsai, 2014; Merker, 2014). A legbefolyásosabb és az empirikusan tesztelt pszichoakusztikus modell a „skaláris várakozási elmélet” (Wearden, 1991; Allman és Meck, 2011). Pszichofizikai kutatások azt mutatják, hogy az emberi időzítés gyakran követi Weber törvényét (Bizo et al., 2006): az időzített időintervallum hibája arányos az adott időtartam időtartamával. Az egyik észlelésen alapuló megfogalmazás szerint az éppen észrevehető különbség (JND) és a referencia inger időtartama közötti arány az inger hossza mentén állandó (Grondin, 2001). Egy másik megfogalmazásban az időtartamok becslésénél a variációs együttható (a standard deviáció elosztva az átlaggal) állandó az időtartamok között (1D ábra; Gibbon, 1977).

Az időzítési mechanizmusok másik releváns megközelítése az idegtudományból és a fizikából származik. Azt sugallja, hogy az idegi rezgések magukba vonják (vagy akár „rezonálnak”) a külső ingerek periodicitásával több időskálán (Buzsaki, 2006; Large, 2008; Arnal és Giraud, 2012; Gupta, 2014; Aubanel et al., 2016; Celma-Miralles et al., 2016). Pontosabban kimondja, hogy az idegi rezgések fázisa és frekvenciája több metrikus szinten együtt jár a külső események fázisával és gyakoriságával. Például egy metronóm ütem feldolgozása alacsony frekvenciájú rezgéseket és/vagy nagy frekvenciájú rezgések teljesítmény ingadozását váltja ki az ütem periodicitása, plusz annak többszöröse vagy osztója után. Kritikusan elmondható, hogy a két vagy több aktív idegi oszcilláció közötti kapcsolat stabilitása, vagyis a külső zavarokkal szembeni „ellenállás”, periódusaik arányától függ (pl. 1: 1, 2: 1, 2: 3). A kis egész számarányok általában nagyobb stabilitást biztosítanak. Ez megmagyarázhatja az egész számarányú ingerek észlelési előnyét a bonyolultabb metrikus mintákkal szemben (Large és Kolen, 1995). Más keretrendszerek azt állítják, hogy a specifikus idegsejtek vagy idegi csatornák meghatározott időintervallumokra vagy tempóra vannak hangolva (Merchant et al., 2013; Bartolo et al., 2014).

Iterált dobolási kísérletek: Kicsi egész arányok kognitív vonzerőként

A legújabb viselkedési kutatások az emberi priorokat vizsgálták a ritmikus minták időtartamára vonatkozóan (Ravignani et al., 2016, 2018; Jacoby és McDermott, 2017). A résztvevők dobolási szekvenciákat kaptak, hogy lehetőségeikhez mérten szaporodjanak. Az előállított mintákat ugyanannak vagy egy új résztvevőnek mutatták be egy iteratív eljárásban. Feltűnő, hogy az „első generációs” résztvevők teljesen véletlenszerű mintákat kaptak, és az „utolsó generációs” résztvevők kis egész számarányú ritmusokat állítottak elő, összhangban a pl. A bimanual koppintással (Peper et al., 1991, 1995a, b; Peper és Beek, 1998).

Konkrétan a résztvevőknek az IOI-k szekvenciáit mutattuk be, amelyek egységes eloszlásból vettek mintát U (pl. 1B ábra). Ahogy a mintákat „reprodukciós láncok” (Ravignani et al., 2016, 2018; Jacoby és McDermott, 2017) útján továbbították, U konvergált egy disztribúció felé D: az IOI-k emberi megfigyelő hátsó eloszlása ​​(pl. 1A ábra). Ez az eloszlás multimodális, és a módokat kis egész számarányok kapcsolják össze, ami az emberi zenei kultúrák univerzális tulajdonsága (Ravignani et al., 2016; Jacoby és McDermott, 2017).

Itt meg akarjuk magyarázni az eloszlást D kialakult pszichofizikai elveken keresztül, amelyek egyike sem von maga után kifejezetten kis-egész arányt. Más szavakkal, az egész számarány elfogultsága önmagában észlelési primitív, vagy alapvetőbb primitívek kölcsönhatásából fakadhat? Jacoby és McDermott (2017) egy elméletileg feltételezett előtagot és a beépített egész számarányokat kapcsoltak össze egy empirikusan becsült priordal, megmutatva, hogy ezek összhangban vannak. Itt megvizsgáljuk, hogy lehetséges-e hasonló tulajdonságokkal rendelkező priorok levezetése azáltal, hogy nem építjük be az egész számarányt, hanem az empirikusan megalapozott időzítési elveket ötvözzük a minimum feltételezésekkel (és a jövőbeli teszteléssel tovább finomíthatjuk).

Az intervallumarány kategóriák valószínűségi következtetése

Konkrét kérdésünk a következő: Milyen feltételek mellett lesz disztribúció G kis egész számot mutatnak, anélkül, hogy ezeket az arányokat beépítettük volna modellünkbe?

Minden feltételezés, eloszlás nélkül G egyenlő lenne az IOI egységes eloszlásával U várakozásban. Más szavakkal, amelyek a ritmusérzékelés és a produkció alapvető mechanizmusait eredményezik, lehetővé teszik számunkra a fordulást U -ba G? Az alábbiakban négy feltételezést tételezünk fel pszichofizikai bizonyítékok alapján, és drasztikusan csökkentjük a modellben szereplő szabad paraméterek számát, kevés általános veszteséggel. Először a korábbi formalizációk kidolgozásával kezdjük, hogy a releváns feltételezések egyértelműek és összehasonlíthatók legyenek.

1. feltételezés: kategorikus időzítés

2. feltételezés: Bayesi következtetés a Gauss-kategóriák felett

A ritmuskutatás általános feltételezése, hogy az észlelés időzítése olyan folyamatként írható le, amely egyesíti a korábbi meggyőződéseket az érzékszervi bemenettel. Ennek matematikai megragadásának egyik módja az időészlelés mint Bayes-i következtetés modellezése (Jazayeri és Shadlen, 2010; Cicchini és mtsai, 2012; Merchant és mtsai, 2013; Pérez és Merchant, 2018). Míg elemzésünk a prior jellegére támaszkodik, nem pedig arra, hogy miként alkalmazzák azt az észlelési értelmezés során, a bayesi nézőpont hasznos. Ez lehetővé teszi egy előzetes eloszlás kifejezését induktív elfogultságként (Thompson et al., 2016), és sikeresen alkalmazták az időintervallum-becslés korábbi modelljeiben (pl. Jazayeri és Shadlen, 2010; Cicchini et al., 2012). Bayes-i következtetéseket alkalmazva jellemezhetjük a résztvevők viselkedését úgy, hogy kategorikus reprezentációt tulajdonítunk az intervallumaránynak rén az eloszlás szerint o(zén = k|rén) ∝ o(rén|zén = k)o(zén = k). Célunk a kategóriák közötti előzetes elosztás, o(zén = k) egyenértékűen G. Alternatív módon lehetőség lenne modellezni a tanulók feltételezéseit a valószínűség eloszlásáról, mint elfogultság forrásáról (pl. Jazayeri és Shadlen, 2010; Cicchini et al., 2012).

Jacoby és McDermott (2017) nemrégiben modellezett n-intervallumritmusok egyetlen pontként a n-1 dimenziós szimplexet, és többváltozós keveréket fogalmazott meg ezen a téren, feltételezve, hogy az egyes keverékek alapját Gauss-modellek képezik. Ugyanis többváltozót fogalmaztak meg o(z) közvetlenül. A priorhoz való hozzáállásunk szorosan összefügg. Jacobyhoz és McDermotthoz (2017) hasonlóan a priorot is Gauss-komponensek keverékeként fejezzük ki. Megfogalmazásunk azonban egy n-intervallumritmus mint halmaz n-1 független minták a egyváltozós multimodális eloszlás, nem pedig egyetlen többváltozós minta. A két megközelítés lényegében a modell kisebb változatait képviseli az intervallumarány-kategóriák kovarianciájára. Az a feltételezés, hogy az eloszlás o(z) Gauss-formájúnak kell lennie a jövőbeni munkában, de összhangban van a meglévő munkával és az első helyes becsléssel.

A priorot a-nak írjuk K-az intervallumarány-kategóriák dimenziós Gauss-keveréke, és az adatok valószínűsége, mint például az i.i.d. Az ilyen kategóriák alapjául szolgáló Gauss-féle, így az intervallumarányok marginális eloszlása ​​a következő:

Itt az előzetes hozzárendeli az egyes Gaussokat k = 1,…, K egy tömeg a keverékben, φk, amely meghatározza a kategória viszonylagos fontosságát; kategóriaátlag μk, amely meghatározza a kategória mögött várható várható intervallumarányt; és egy kategória variancia σk. Feltételezzük, hogy a súlyok állandóak: φ k = K - 1 (ami azonos számú megfigyelésnek felel meg a Gaussiaknál az 1C – E ábrákon). Bár reméljük, hogy ezt a feltevést a jövőben empirikusan megvizsgáljuk, a legsemlegesebb feltételezés szerint járunk el: egyetlen intervallum-arány kategória sem privilegizált.

3. feltételezés: Kis számú másodlagos kategória

Feltételezve, hogy a priorok kategóriáinak indexelését szigorúan a kategóriaeszközök szerint rendezik, úgy, hogy μ j μ k ⇔ j k, azonnal kifejezhetjük az eloszlás második empirikus korlátozását G: csak kevés kategória létezik (Desain és Honing, 2003; Motz et al., 2013; Ravignani et al., 2016, 2018). K természetesen korlátozza az a megközelítés, hogy csak a kicsi egész számok, és ezek száma korlátozott. Továbbá lekötöttük a kategóriák átlagának μ tartományátk 200 ms-tól (London, 2004, 35. o.) és 1000 ms-ig (Shaffer, 1983; Desain és Honing, 2003; Buhusi és Meck, 2005). Ez a korlát korlátozza K a kategóriák legnagyobb számára úgy, hogy egyik kategóriaátlag sem haladja meg az 1000 ms-ot:

4. feltételezés: skaláris időzítés

Eddig feltételezéseink nem korlátozzák egyik kategóriát sem azt, hogy μk sem szórások σk. Végső, talán legközpontosabb feltételezésünk, hogy az időzítés megmutatja skaláris tulajdonságok az itt figyelembe vett második másodperc alatti tartományban (Gibbon, 1977; Matell és Meck, 2000). A skaláris időzítés drasztikusan csökkenti az eloszlást leíró szabad paraméterek számát G, a kategóriavariánsok kifejezésével a kategóriaeszközök függvényében. Az egyes kategóriák szórása σk megegyezik az átlag μ-velk szorozva egy állandó, dimenzió nélküli tényezővel s (1E. Ábra):

Becsült korábbi empirikus jelentések s közelíteni 0,025 (Friberg és Sundberg, 1995; Madison és Merker, 2004).

A kategorikus percepció és a skaláris időzítés összekapcsolása: Mennyire közel lehetünk az egész arányarány-intervallumokhoz?

Mind a négy feltételezés empirikus alapú és független egymástól. Most, G tovább jellemezhető a keveréket alkotó Gauss-féle átfedés mértékével. Ennek formalizálásához feltételezzük az egyes kategóriákat k keresztezni a szomszédos szomszédaival k-1 és k+1 c k l-rel és c k u-val arányos távolságban, az átlagos μ-tól távolk (1F. Ábra), amely a σ szórás állandó hányadak. c k l és c k u paraméterezik a kategóriák közötti átfedést: kifejezik, hogy hány szórása van az átlag μ-tőlk a klaszter k metszik a fürtöt k+1, és hány szórás van az átlagos μ-tólk+1 a klaszter k+1 metszik a fürtöt k (Az 1F. Ábra egy példát mutat be k = 1,2).

A paraméterezett átfedés ötletének egyesítése a skaláris tulajdonságokkal, az egyes fürtökkel k μ k - s c k l μ k-től μ k + s c k u μ k-ig terjed. Ezen feltételezések szerint két szomszédos eloszlás átlaga közötti távolság (1F ábra) felírható