Equànim i objectiu, farcit de suggerències raonables i de constatacions depurades. Autor de diversos blocs literaris molt ben escrits: Aforismes, Anoharra, Diccionari Catalús, Haikus, Rimbaud, Talleret d'Art, ... Tot un mestre
Articles sobre l'actualitat per Josep Selva. Un estil modèlicament personal: prosa de factura lleugera amb moltes connexions neuronals per a que les idees volegen per damunt el previsible
Blog de Llorenç Carreres dedicat sobretot a la literatura. "Som allò que llegim i tenim el que dam" (Ponç Pons). Magnífiques troballes culturals, articles molt interessants, múltiple erudició tot terreny per a gaudir millor del plaer dels llibres
Toni Ibañez: iniciatives enèrgiques i propostes obertes, dietari molt actualitzat d'un filòsof i escriptor guardonat amb premis importants. Creador del concepte de "catosfera" i d'un diccionari de "blogologia"
Notes personals d'Emili Morant Llorca, des d'Almoines (la Safor): discurs autobiogràfic sincer i ben concatenat, amb "esprit de finesse" i "esprit de geómetrie"
L'escriptora mallorquina Xesca Ensenyat fa vibrar la llengua catalana amb un patrimoni lèxic excepcional i un doll d'enunciació líquida ben revitalitzat
L'home de teatre de més llarga trajectòria al PV. Dramaturg valencià. Criteri independent i innovació temàtica. Les seues obres magistrals segueixen explicant la contemporaneïtat més recent.
La sociòloga i actriu amb més "vis còmica" de les comarques del Sud: monòlegs, fotos, vídeos, espectacles, radionovela "La dona de l'alcalde". Fent país amb rialles intel·ligents
Apunts diaris enginyosos sobre la vida quotidiana, les lectures i els pensaments d'una xica de la Safor. Espontaneïtat i do de la improvisació, realisme biogràfic i honestedat creativa
Memòria personal i instantània d'una noia que ja té una edat. Sinceritat i consciència multiplicades per mil: el dietari en català portat al grau 10 de l'empatia
Un magnífic escriptor valencià de Xàtiva exercint l'esperit crític per a dir les coses clares -- negre sobre blanc--. L'anàlisi intel·ligent i lúcida, el contrapunt informatiu
Blog sobre política, historiografia i altres divertiments personals escrits a recer del vent de ponent per Vicent Baydal, una barreja de xaloc i tramuntana
Bloc amb notícies de les comarques centrals valencianes, articles d'opinió, fotografies, ressenyes de viatges, creació literària... realitzat per Ximo Corts
Amb una majoria absoluta del PP. Alcaldesa Honorífica: la Mare de Déu de les Injúries, "patrona" de la localitat. Regidors nacionalistes en l'oposició: Vicent Llobell i Cèsar Ferrando.
Coordinat per un nou equip de govern quadripartit PSPV+Iniciativa Independent+Bloc Nacionalista Valencià+Esquerra Unida. Regidor nacionalista amb tasques de govern: Vicent Serra.
L'Associació d'Allotjaments Rurals de la Muntanya d'Alacant fa una magnífica oferta en cases de lloguer per a turisme d'interior als emblemàtics pobles del nord de la província d'Alacant
Lectures, articles, reflexions i assajos d'Enric Balaguer, veí del poblet de Gines: "haver crescut a la Vall de Guadalest és una experiència transcendental".
Des de la Vila Joiosa, l'activisme i el coneixement de la Natura de la Marina Baixa: batalles legals per restaurar els drets del medi ambient i iniciatives de divulgació ecològica.
"La Veu del Bloc Nacionalista Valencià de Callosa d'en Sarrià", una web múltiple de política municipal en la que participen diverses persones amb les seues opinions i projectes: la intel·ligència col·lectiva en xarxa!
Article d'anàlisi dels origens de la repoblació mallorquina a la comarca de la Marina. Divulgat per Antoni Mas i Forners i amb la participació del filòleg Joan-Lluís Monjo, natural de Tàrbena.
El veritable parc temàtic natural de Callosa d'en Sarrià: fonts, cascades i tolls per a prendre el bany dins un paisatge verdíssim de geologia kàrstica
El recent 24 d'abril vaig estar a Barcelona en la Seu de l'Institut d'Estudis Catalans (IEC) per assistir i participar en el lliurament dels Premis Sant Jordi, juntament amb els altres guardonats i guardonades. Es tracta de la LXXVII convocatòria d'aquestes característiques.
Recordem que l'IEC és la "corporació acadèmica, científica i cultural l’àmbit d’actuació de la qual s’estén a les terres de llengua catalana, fou fundat l’any 1907 amb l’objectiu de promoure l’alta investigació científica, principalment la de tots els elements de la cultura catalana. És una llarga tradició de l’Institut d’Estudis Catalans atorgar premis a institucions i a persones que, amb llur activitat i treball, contribueixen a assolir la finalitat de l’Institut".
El meu projecte d'investigació es titula "Dialectometria sobre les cartografies de la llengua catalana: aplicació del cluster analysis per a l'obtenció de resums jeràrquics i arborescents". Aquest projecte concorria en la modalitat de Borses d'Estudi dels Països Catalans, des del País Valencià.
Més info oficial sobre els Premis Sant Jordi de l'IEC, clica ací.
Imatge: Grup de guardonats i guardonades en la convocatòria d'enguany.
1.- Un motiu de satisfacció recent
Aquesta setmana m’ha arribat per correu postal la revista Índex, el butlletí núm. 14 de la Coordinadora de Dinamització Lingüística del País Valencia (CDLPV); en aquest número ha estat editat un article meu sobre dialectometria (el podeu consultar si cliqueu ací), a la vora d’un estudi comparatiu de Gabriel Bibiloni sobre el tractament de la nostra llengua en els diferents estatuts autonòmics i a la vora d’un recull de locucions i modismes històrics valencians elaborat per Josep Lozano. La meua participació a Índex ha estat per iniciativa de Miquel Boronat (collistaire de Migjorn i impulsor de www.einesdellengua.org).
Epígrafs del post:
2.- Difussió i recepció en els darrers anys
3.- Condicions biogràfiques de producció.
4.- Altres projectes semblants d'anàlisi linguística multivariable.
5.- La llengua dels Països Catalans.
Imatge: Mapa de Tòkio, Japó, amb el barri de Meguro-ku al centre: un bon dia em va arribar des d'allí un paquet postal ben voluminós amb les troballes, entrevistes i articles científics del professor Hiroto Ueda, coordinador del projecte d'investigació lingüística global VARILEX.
Aplicació de tècniques de socio-estadística avançada en l’anàlisi de
dades dialectals: classificació dels parlars locals de la Marina[1]
<<<---- punxeu damunt el gràfic per ampliar-lo i visualitzar-lo millor
per Joan-Carles
Ortega i Berenguer
sociòleg i escriptor
1.- Estadística i dialectologia: una
aproximació.
oeÉs sorprenent que els estudiosos de les ciències socials que d’alguna
manera estan implicats en el llenguatge hagen fet tan poc per aplicar els
descobriments i els mètodes del seu camp general de treball als problemes que
ací hem analitzat.”
(WEINRICH: 1996 [1953], 246)
Aquesta afirmació, alhora
crítica i engrescadora, fou proferida fa més de 40 anys i, a pesar del temps
que ha passat des d’ençà, encara conserva una certa vigència, sobretot si la
referim, amb amplitud de mires, als estudis quantitatius sobre la variació
lingüística en general, a la geolingüística i als estudis areals dels parlars
locals en particular; més encara, l’afirmació de WEINRICH conserva quasi tota
la seua vigència, si només considerem la metodologia emprada als estudis de
dialectologia regional del sud del País Valencià. Des del punt de vista
metodològic, allò que cal destacar de la dialectologia és un grau de
modernització feble; en especial, un grau de modernització molt feble, gairebé
decimonònic, de les seves tècniques d’anàlisi estadística de dades.
Un dels millors dialectòlegs del
domini lingüístic del català, fent un repàs sobre la teoria i la metodologia de
la seva disciplina, comenta que, entre oeels retrets més importants que hom ha
fet a la dialectologia i a la geografia lingüística” figura el de oela limitació
a un simple descriptivisme. Davant l’abundor de materials arreplegats, els
dialectòlegs foren incapaços de fer-ne una selecció…” (COLOMINA: 1995). És a
dir, hi ha un contrast extraordinari entre l’enorme capacitat dels dialectòlegs
per a acumular un corpus de dades
dialectals i l’escàs nivell d’anàlisi estadística que s’hi realitza de les
dades.
Ara bé, aquest contrast
metodològic és major en la dialectologia regional ( i, sobretot, en la
geolingüística) que en la dialectologia urbana o en la dialectologia social.
Segons VIAPLANA (1996), des de la dialectologia urbana oes’ha criticat la
dialectologia regional per les seves tendències rurals i arqueològiques; però
també, i sobretot, pels criteris de selecció d’informants i pels criteris de selecció
i tractament de les dades”. En concret, les crítiques posen de relleu, per
exemple, oeel nombre reduït d’informants – a vegades un de sol[2]-- i la tria d’informants ad libitum per part dels enquestadors » [sic[3]] (VIAPLANA : 1996) així com que « la massa
de dades, internament dispersa, que se sol obtenir de les enquestes[4] dialectals de base regional […] solen desplaçar-se
directament del bloc de notes de l’enquestador[5] al mapa…” (VIAPLANA: 1996). En aquest sentit no és
d’estranyar, com afirma VIAPLANA (1996), que els dialectòlegs urbans
s’escandalitzen davant els treballs dels dialectòlegs regionals, arribant fins
i tot, en alguns casos, a desqualificar llur tasca investigadora amb adjectius
com oeacumulativa, atomística, irrellevant”.
Alguns recursos estadístics que
s’han emprat en dialectologia urbana són els següents (VIAPLANA: 1996):
A)Selecció dels
entrevistats seguint un disseny mostral aleatori.
B)Estadística
descriptiva univariable (amb mesures de tendència central i de dispersió).
C)Estadística bivariable, posant en relació variables lingüístiques (per
exemple, ús de variables fonètiques i ús de variables morfològiques) i
variables socials (edat, sexe, classe social, professió, barri, tipus
d’habitatge, etc.)[6].
D)Resums gràfics per
a mostrar les relacions entre dues o tres variables.
E)Tests de
significació estadística de les mesures obtingudes.
Per una altra banda, GIMENO (1991), referint-se als
parlars de la província d’Alacant, considera que oeel análisis de la regla
variable y las escalas de implicación han resultado elementos fructíferos para
sistematizar el estudio de la variación lingüística y modelar formalmente la
competencia comunicativa multilectal de nuestras comunidades de habla”. Alguns
dels autors que han desenvolupat aquestes tècniques d’anàlisi (el càlcul de
regles variables i les escales d’implicació) en el marc de les comarques del
sud del País Valencià són, respectivament, MONTOYA (1986) i COLOMINA (1985). El
primer d’ambdós ha demostrat, entre altres coses, com el procés de variació lingüística
en la llengua catalana dels documents municipals d’Oriola i Elda, durant l’Edat
Moderna, ha estat un pas previ en el seu procés de substitució per la llengua
castellana. MONTOYA ha utilitzat el programa d’informàtica estadística VARBRUL
2S, elaborat per SANKOFF (1979). Aquest programa serveix per a calcular oeles
probabilitats d’aplicació d’una regla variable (= un canvi en curs) i ens
indica quins són els grups de factors[7] que
afavoreixen o bloquegen la realització de la variable. És a dir, ens proporciona
un model de competència de qui parla, escriu o simplement transcriu… La
probabilitat de donar-se una regla s’enclou entre 0 i 1, on 0 vol dir que la
seua aplicabilitat és nul·la i 1 significa que no hi ha cap restricció al seu
funcioment; els valors per damunt de 0,5 ens indiquen l’aplicació de la regla i
els inferiors la no aplicació” (MONTOYA: 1986).
D’acord
amb la definició de RAIMONDO (1991), les escales d’implicació són oemodels que
donen compte de la variació lingüística, les diverses variants són disposades
en una gradació que depén de les seves relacions d’implicació: la variant A no
pot aparéixer si no ha aparegut la variant B, que no pot aparéixer si no ha
aparegut la variant C, etc.”. COLOMINA (1985) construeix una escala
d’implicació per a explicar la caiguda de la /-d-/ intervocàlica en el parlar
de la comarca de l’Alacantí, en paraules que van des de oeredó” (reó), la més
freqüent, a oesaludar” (saluar), la menys freqüent. L’escala d’implicació està
formada per una matriu de dades on hi ha 28 municipis * 30 paraules on es pot
elidir la /-d-/ intervocalica, de manera que s’observa la tendència a què els
pobles de més al Sud perden més /-d-/ intervocàliques, d’una manera
implicativa, que els pobles més septentrionals de l’àrea estudiada, en
consonància amb el seu grau d’exposició a la influència/interferència del
castellà[8].
Segons MONTOYA (1986), aquesta escala d’implicació de COLOMINA fou la primera
que es va realitzar dins l’àmbit del domini lingüístic del català.
Com
a balanç, en aquesta breu aproximació a l’ús que s’ha fet dels procediments
quantitatius en dialectologia, podem sostenir dues idees: a) la dialectologia
regional no ha estat tan oerural i arqueològica” com critiquen els dialectòlegs
urbans, almenys pel que toca a la dialectologia regional que han practicat
alguns filòlegs[9] en el sud del País
Valencià; b) sembla ser que en la dialectologia urbana en particular i, per
tant, en dialectologia en general, no s’han emprat tots els recursos
estadístics disponibles en les ciències socials, ja que no s’ha recorregut a
l’ús de les tècniques de sòcio-estadística multivariable, la qual cosa, com
veurem seguidament, podria aportar contribucions interessants en el camp de la
dialectologia i, fins i tot, en el camp de la geolingüística.
2.- Tècniques de socioestadística
multivariable: l’anàlisi de conglomerats jeràrquics.
<<<---- punxeu damunt el gràfic per ampliar-lo i visualitzar-lo millor
Existeixen diverses tècniques de
socioestadística multivariable que poden ajudar el dialectòleg a trascendir el
mer marc descriptiu del seu objecte d’estudi, proveint-lo tant d’eines
avançades per a explorar l’estructura de les dades de la variació lingüística
d’allò que pretén analitzar així com per a fornir el seu treball d’explicacions
plausibles. El gran avantatge pràctic d’aquestes tècniques és que permeten
obtenir resums sintètics de les dades dialectals recollides (la qual cosa és
ben útil, si se segueix una estratègia exploratòria), de reduir la
multidimensionalitat d’un corpus de dades considerable alhora que es posen de
relleu factors latents o alhora que es fan evidents relacions entre un número
indeterminat de variables o de casos (la qual cosa aprofitarà per a seguir una
estratègia explicativa).
Per a accedir a una visió de
conjunt, aquestes tècniques han estat classificades de diverses maneres, en
funció de diferents criteris. Un dels esquemes classificatoris més coneguts les
divideix en tècniques en les quals hi ha una o més variables dependents i
tècniques en les quals no hi ha cap variable dependent, perquè es parteix del
supòsit de què les relacions entre variables són d’interdependència (vegeu Figura 1).
Les tècniques que tracten
d’explicar la variació d’una variable dependent podrien emprar-se per a
estudiar allò que els filòlegs anomenen el comportament extern del llenguatge.
En aquest sentit, aportarien un grau de sofisticació metodològica inusitat al
tipus d’estudis ja encetats en la dialectologia social per l’escola de LABOV,
és a dir, aquells estudis que assumeixen que la variació lingüística no és
completament fortuïta ni lliure, sinó que pot dependre, en alguna mesura, de
variables sociològiques. Per una altra banda, les tècniques que eluciden
relacions d’interdependència[1] entre
variables dialectals o entre casos poden ajudar per a obtenir panoràmiques
globals del seu comportament, per a resumir molta informació d’una manera
lògica, no intuïtiva, i per a conformar noves variables sintètiques d’aspectes
lingüístics que es poden contrastar, posteriorment, amb el seu context social,
històric o cultural.
Com a botó de mostra, farem ací
una demostració de com caldria aplicar la tècnica d’anàlisi multivariable
anomenada Cluster analysis. Es tracta
d’una tècnica que originalment fou emprada fa més d’un segle en el camp de la
biologia per a elaborar taxonomies d’animals. Posteriorment ha estat
desenvolupada en els darrers vint anys per al camp de les ciències socials,
fins el punt que hi ha paquets integrats d’informàtica estadística com l’SPSS (Statistical Packet for Social Science) que
l’han incorporada. Dins del món de les ciències socials el Cluster analysis ha estat utilitzat amb èxit per a propòsits i
continguts tan diversos -- per citar alguns exemples – com classificació de les
legislatures en funció de l’ofici dels membres dels diferents parlaments
històrics (GARCÍA FERRANDO: 1989, pàgs. 451-454) o com la taxonomia dels
sistemes polítics de diferents països occidentals segons el grau de legitimació
de llur estat de benestar i segons la percepció del conflicte de classe de
llurs societats (NOYA: 1997, pàgs. 267-295), així com també la construcció de tipologies
de ciutats europees[2].
Explicarem a continuació, per
damunt-damunt, les passes que es segueixen per a dur a terme una anàlisi de
conglomerats jeràrquics o hierarchical
cluster analysis:
a)En primer lloc,
necessitem començar amb una matriu de variables i casos. En aquest estadi de
l’anàlisi hem de triar dues coses: (1) seleccionar les variables; (2) elegir un
nivell de medició (ordinal, interval, etc.). La selecció de variables és feina
del dialectòleg, el qual en funció dels seus objectius i del seu coneixement
expert de la matèria ha de decidir quines variables mereixen entrar en l’estudi
i quines no. El nivell de medició, en aquest cas, ha de ser necessàriament
mètric, per a la qual cosa transformarem les variables nominals en variables dummy (=fictícies) dicotòmiques. En la
nostra matriu hi haurà tant variables dicotòmiques privatives (en les quals el
valor 1 significa la presència d’una característica determinada en un poble x,
i el valor 0 significa l’absència d’eixa característica), així com variables
dicotòmiques equipolents (en les quals només hi ha dues alternatives: 1, que és
una característica, i 0, que és la característica alternativa), per tal
d’estalviar-nos una acumulació excessiva de variables fictícies que es
correlacionen entre elles.
b)En segon lloc,
transformem l’anterior matriu de dades en una matriu de similaritats entre
casos, prèvia selecció d’un criteri de similaritat, en la que s’expressaran les
distàncies de cada cas respecte als altres. Hi ha diversos criteris de
similaritat[3]: ací utilitzarem el
criteri de la distància euclídia al quadrat per a mesures dicotòmiques, perquè
és el més comunament acceptat. La distància euclídia al quadrat entre dos casos
es defineix com a la suma de les diferències al quadrat dels valors en cada variable.
c)En tercer lloc,
obtenim la formació dels diferents grups de casos mitjançant l’aplicació d’un
algoritme de classificació a la matriu de similaritats. En aquest cas recorrem
a l’algoritme o mètode de vinculació inter-grups, que és el més amplament
utilitzat. Aquest mètode combina els conglomerats per a minimitzar la distància
promedi entre totes les parelles d’elements en les que cada membre de la
parella forma part de cadascun dels dos conglomerats.
d)En quart i últim
lloc, i per tal de facilitar una millor comprensió dels resultats, el procés de
formació de oeclusters” o conglomerats es representa de forma gràfica. Ací
utilitzarem la representació gràfica més coneguda: és a dir, el dendograma o
estructuració arborescent de les proximitats entre casos
Per expressar-ho gràficament, en el procés d’anàlisi de
conglomerats es segueix la seqüència de la Figura 2.
3.- Un exemple: classificació dels
parlars locals de la comarca de la
Marina (Sud del País Valencià).
<<<---- punxeu damunt el gràfic per ampliar-lo i visualitzar-lo millor
Les unitats o àmbits del nostre anàlisi de conglomerats
sobre els parlars locals són els municipis, ja que es parteix del supòsit de
què cada poble és un cas. Així doncs, en l’exemple que oferim tenim en compte els
cinquanta quatre municipis de la comarca de la Marina. A més a més, triaré variables
fonètiques, morfològiques i lèxiques dels parlars locals de la comarca de la Marina, incloent la
pràctica totalitat de les que s’exposen als mapes comarcals geolingüístics del
llibre El Parlar de Pedreguer i unes
quantes més[4] per a observar les variacions
internes en el subgrup dels pobles de la Marina Baixa. En concret, totes
eixes variables són les que seguidament s’expressen:
(a)Variables fonètiques: pronunciació d’[új]/[wí];
pronunciació d’[j/],[/],[t/]; caiguda de la –t postconsonàntica final (en mots
com pont, Alacant, i molt); pèrdua
de la –r en infinitius i mots aïllats; pèrdua general de la –r postvocàlica
final; pronunciació de [dz]/[z] en les variants del mot albergínia; altres dues variants fonètiques de pronunciació del mot
albergínia (-ina/-ínia, inja;
-ínia/-ènia); pronunciació de treure/
traure; pronunciació de –tl- com a [ll]/[l]/[ld]; variants fonètiques del
mot ametlla; variants d’enfosquiment
de la –o- en el mot bombot; caiguda
de la –d- intervocàlica en els mots fotuda
i ferida;
(b)Variables morfològiques: l’article personal [al] (lo),
la i [an]/l’, la; pronom feble de segona persona [at]/[al]/[el]; adverbis ací / aquí; construcció de li ho / li ho, li’l, li-la; alternativa de
compra-te-ne/ compra-te’n;
(c)Variables lèxiques: formes de dir arrel; formes d’oreneta ;
timó-net / friula, frígola ; formes de bacallà ; formes de ventall ;
formes d’antic ; formes d’u(n) ; formes de col-i-flor ; formes de cogombre ; formes de bolet ; formes de llangardaix ; lletuga/encisam ; roig/vermell ;
formes de pintó; llimó/llima; panís/dacsa
Vegem, per tant, que han estat incloses poc més de
trenta-una variables reals, que desglossades convenientment en variables dummy dicotòmiques, es converteixen en
més de cinquanta-cinc. Probablement no estem davant d’una selecció exhaustiva,
però almenys és prou representativa i, com veurem, permet d’arribar a resultats
molt il·lustratius.
Una volta aplicat el procés
d’anàlisi de cluster comentat anteriorment, obtenim un dendograma en què es
classifiquen, d’una manera arborescent, tots els municipis de la comarca de la Marina en funció del seu
parlar.
Allò que cal destacar, en primer
lloc, del dendograma presentat és que hi ha dos grans grups ben clarament
definits: la demarcació de la Marina Alta,
dins la qual cal comptar el parlar de Tàrbena, i la demarcació de la Marina Baixa, dins de la qual
cal incloure a Castell de Castells i a Beniaia.
Aquestos casos discordants amb
els límits subcomarcals de Marina Alta/Marina Baixa ens fan pensar que
exerceixen el paper de parlars fronterers o de transició, atés que apareixen
com a atípics dins llurs clusters respectius: sembla, per tant, que no hi ha
ruptures multilectals entre una subcomarca i l’altra, sinó que hi ha més aviat
un continuum lingüístic.
Existeix un fort grau de
correlació entre els raïms de conglomerats i la distribució espacial dels
termes municipals dels pobles ; per exemple, dins el conjunt de pobles de la Marina Baixa hi ha una divisió
ben clara entre, per una banda, els pobles de la Vall de Guadalest més Polop,
Callosa d’en Sarrià, Bolulla i Castells (la subzona de l’interior[5]) i la
franja litoral i pre-litoral, en la que cal englobar la resta de municipis de la Marina Baixa.
Pel que fa a la Marina Alta, l’agrupació de
conglomerats és més complexa, però no exempta, igualment, d’una certa lògica de
continuïtat territorial. Sense tenir en compte el parlar de Xàbia, que és un
cas atípic, i el de Tàrbena, que des d’aquest punt de vista és un oeparlar-pont”
que està pròxim a la Marina Alta,
podem observar que hi ha certs subgrups relativament homogenis: els parlars de
l’interior muntanyenc (des de Beniali a la Vall d’Ebo), pròxim a la comarca d’El Comtat;
Calp, Teulada, Poble Nou de Benitatxell i Dénia formarien una mena de franja
litoral ben definida; Benissa, Senija i Murla semblen tenir parlars locals molt
semblants; i la resta de pobles de la Marina
Alta s’inclouen en subgrups pròxims als esmentats
anteriorment i a la comarca de la
Safor.
La correlació entre els clusters i l’espai és
suficientment important com a permetre el trasllat dels resultats del
dendograma a un mapa, que, òbviament, constituiria el resum d’un bon grapat
d’isoglosses.
A més a més, no hem de deixar de
banda la qüestió de què només observant la matriu de similaritats entre casos
(pobles) ja estem en condicions d’afirmar quines parelles de pobles són les més
distants i quines les més pròximes. Així, en aquesta anàlisi, les majors
puntuacions de distàncies euclídies entre casos es donen, per ordre decreixent
d’importància, entre Relleu i Xàbia (d=33), Finestrat i Xàbia (d=27), Poble Nou
i Relleu (d=27), Teulada i Relleu (d=27), Castell de Castells i Xàbia (d=26),
Finestrat i Pedreguer (d=26), Alcanalí i Relleu (d=25), la Llosa i Altea (d=25). Pensant en sentit
contrari, els parlars locals que més s’assemblen són els de Benigembla i
Parcent (d= aproximat a 0)[6],
Sagra i Tormos (d=aprox. 0), Benidoleig i
Tormos (d= aprox. 0), Sagra i Benigembla (d=aprox. 0), Alcanalí i Parcent
(d=aprox. 0)…
El parlar de Callosa d’en Sarrià
assoleix les màximes dissimilaritats respecte a Xàbia (d=24), Pedreguer (d=
21), la Llosa
(d=20, Jesús Pobre (d=20), Gata (d= 19) i la Xara (d= 19). Per a saber quins parlars
s’assemblen més al de Callosa d’en Sarrià, només cal consultar el dendograma i
veure els raïms de pobles més pròxims.
4.- Implicacions de l’anàlisi de
conglomerats en dialectologia.
Encara que siga a desgrat del
que s’ha vingut sostenint fins a aquest punt, no convé que ens deixem
enlluernar per les enormes possibilitats heurístiques de l’anàlisi de conglomerats.
A l’igual que la majoria de les altres tècniques d’estadística avançada, cal
valorar-la únicament com al que és, és a dir: tan sols una forma d’argumentar
ben consistent, fundada en principis matemàtics ben sòlids, que ens pot dur a
sostindre com a vàlides diferents menes de proposicions en funció de les
premisses de què partim.
Aningú se li escapa que fer un dendograma
basat en variables lèxiques pot resultar una tasca ben incommensurable i sempre
inconclosa, ja que una llengua i les seues variants tenen moltíssimes formes
lèxiques. Però dur a bon port un dendograma basat en variables morfològiques és
quelcom molt més fàcil de completar, per no esmentar si el basem únicament en
variables fonètiques (que òbviament en són moltíssimes menys o, almenys,
resulta més fàcil de determinar quines són les més importants).
Tanmateix, fetes aquestes
prevencions, també és just que ponderem allò de positiu amb què hom pot
contribuir en el camp de la dialectologia, si s’utilitza adequadament tant el hierarchical cluster analysis com
qualsevol altra tècnica d’anàlisi multivariable.
En primer lloc, és indubtable
que l’anàlisi de conglomerats constitueix una eina que pot enriquir notablement
el bagatge i els recursos de la dialectologia. No és una eina més o una eina
qualsevol, sinó una eina que pot fer avançar els dialectòlegs en el camí del
desenvolupament científic de la seva disciplina, de la mateixa manera com amb
anterioritat ha ajudat els sociòlegs.
En aquest sentit, cal destacar que els acostumats mapes
dels clàssics atles de geolingüística, en els quals habitualment només hi
figura una sola variable per mapa, poden ésser processats globalment per tal
d’obtenir un mapa sintètic final en el que s’hi reflectesca el comportament
d’incontables variables.
Amb açò es guanya que, en les monografies dialectals,
entre l’exposició descriptiva de les dades brutes i l’elaboració de les
conclusions finals no hi intercedesca només el coneixement intuïtiu: amb
l’anàlisi del cluster els dialectòlegs poden expressar d’una forma lògica (a
través de l’ús de l’estadística) perquè, per exemple, tal o qual conjunt de
pobles tenen un parlar tan similar que hi formen un grup.
A més a més, cal no oblidar que darrere tot canvi o
innovació metodològica hi subjau, latent, la possibilitat d’un canvi o addició
de perspectiva teòrica. Si la tècnica de les escales d’implicació és una
fòrmula operativa amb la que s’expressa i es reforça la teoria de la difussió o
teoria de les ones (un model súmmament senzill que prové de l’antropologia
difussionista del segle XIX i que ha estat desenvolupat per la geografia humana
sueca fa més de trenta anys), qui sap si la tècnica del cluster analysis pot aprofitar, en tant que una altra fòrmula
operativa, per a repensar i actualitzar el vell paradigma de la teoria de
l’arbre. En la meua opinió, l’aplicació de tècniques d’estadística avançada a
l’anàlisi de dades dialectals pot aportar a la dialectologia nous esquemes
teòrics, nous marcs d’interpretació. Per últim, només em resta fer èmfasi en que
l’associació entre el dendograma de parlars i la seua distribució espacial no
és la única que podem assajar per a interpretar les seues causes i raons
últimes. Fent una anàlisi de cluster podem crear una nova variable sintètica,
la de pertanyença de cada parlar local al cluster, que és molt susceptible de
veure’s analitzada i correlacionada amb d’altres variables socials,
històriques, econòmiques i culturals a través d’altres tècniques d’anàlisi
multivariable.
ALVARO, José Luís, Análisis de datos en ciencias sociales. Una
introducción al SPSS/PC+, Madrid: CIS, 1995.
ALVIRA MARTÍN, Francisco,
oeIntroducción al análisis de datos”, en GARCÍA FERRANDO, Manuel (comp.), El análisis de la realidad social,
Madrid: Alianza, 1986.
DANE, Research methods, Los Ángeles, Califòrnia: Wadsworth, 1990.
DE VAUS, D.A., Surveys
in social research, Londres: Unwin Hyman Ltd., 1990 (1986).
GARCÍA FERRANDO,
Manuel (comp.), El análisis de la
realidad social, Madrid: Alianza, 1986.
GARCÍA FERRANDO, Manuel, Socioestadística. Introducción a la
estadística en sociología, Madrid: Alianza Editorial, 1989.
GARCÍA FERRANDO, Manuel, Sobre el método. Problemas de investigación
empírica en sociología, Madrid: CIS, 1979.
GARCÍA ROLDÁN, José Luis, Cómo elaborar un proyecto de investigación,
Alacant: Universitat d’Alacant, Secretariat de Publicacions, 1995.
KORN, Francis; LAZARSFELD, Paul,
i d’altres, Conceptos y variables en la
investigación social, Buenos Aires: Ediciones Buena Visión, 1969.
LÓPEZ PINTOR, Rafael, oeEl
análisis de los datos de encuesta”, en GARCÍA FERRANDO, Manuel (comp.), El análisis de la realidad social,
Madrid: Alianza, 1986.
NOYA MIRANDA, Francisco, oePresentación.
Ciudadanía y capital social. Estudio preliminar en torno a Ciudadanía y clase
social, de T.H. Marshall”, Revista
Española de Investigaciones Sociológicas, núm. 79, CIS: Madrid, 1997.
SÁNCHEZ CARRIÓN, Juan Javier, Análisis de tablas de contingencia: el uso
de los porcentajes en las ciencias sociales, Madrid: CIS, 1989.
TERMCAT (Centre de
Terminologia), Diccionari de sociologia,
Barcelona: Fundació Barcelona, 1992.
Sobre dialectologia i lingüística
BELTRAN, Vicent; i GARCIA,
Josepa, El parlar de Pedreguer,
Pedreguer: Institut d’Estudis Comarcals de la Marina Alta, 1994.
BELTRAN, Vicent, El parlar de Callosa d’en Sarrià i de les
Valls de Tàrbena i Guadalest. Aportació al vocabulari fitonímic i zoonímic
valencià, València: Conselleria d’Educació i Ciència, 1995.
BELTRAN, Vicent, oeJordi
Colomina: amb un trosset de Callosa”, Revista La Plaça,
núm. 5, Callosa d’en Sarrià: Edita Col·lectiu Nacionalista, 1994.
COLOMINA, Jordi, L’alacantí. Un estudi sobre la variació
lingüística, Alacant: Institut de Cultura oeJuan Gil-Albert”, 1985.
GIMENO MENÉNDEZ, Francisco,
oeLengua y sociedad”, en Manuel OLIVER NARBONA (coord.), Cultura popular e
industrias tradicionales, tomo VII de la Historia de la Provincia de Alicante, Murcia: Ediciones del
Mediterráneo, 1991.
MONTOYA ABAD, Brauli, Variació i desplaçament de llengües a Elda i
Oriola durant l’Edat Moderna, Alacant: Institut de Cultura oeJuan
Gil-Albert”, 1986.
RAIMONDO CARDONA, Giorgio, Diccionario de lingüística, Editorial
Ariel: Barcelona, 1991.
VIAPLANA, Joaquim, Dialectologia, València: Universitat de
València, 1996.
WEINRICH, Uriel, Llengües en contacte, Alzira: Bromera,
1996 (1953).
[1]Agraesc a l’amic Vicent BELTRAN el seu interés apassionat per estudiar i
difondre aspectes cabdals de la dialectologia del nostre tros de país així com
per encomanar-me, en virtud del seu entusiasme, una certa inquietud per aqueixa
disciplina. Li agraesc sobretot que m’haja facilitat, amb una generositat
exemplar, algunes de les dades inèdites a partir de les quals he desenvolupat
l’aplicació de la tècnica del hierarchical
cluster analysis que més avant s’exposa.
[2] L’autor vol dir que a voltes es tria només un
informant per a conéixer la parla local d’un municipi, per exemple.
[3] L’autor no diferencia, a l’igual que molts d’altres
col·legues dialectòlegs, entre, per una banda, enquesta o survey (amb mostreig aleatori) i enquestadors (que són els que
apliquen l’enquesta a la mostra), i, per una altra banda, qüestionari (que es
pot aplicar a una mostra seleccionada sense mostreig aleatori) i entrevistadors
(que són els que apliquen qualsevol qüestionari, provinga o no d’un survey). Des del punt de vista
sociolingüístic, podem suggerir que quan els dialectòlegs parlen
indiscriminadament d’”enquestes” ho fan realitzant una sinècdoque (prenen una
part pel tot) com a figura retòrica de pensament que proveeix de major
cientificitat al seu discurs (ja que la paraula oeqüestionari” té menys
connotacions científiques que la d’”enquesta”).
[6] Cal remarcar que VIAPLANA (1996) no exposa la variada
gama de mesures i estadístics aplicables a les taules de contingència, per a
veure, entre altres coses, distintes formes d’explicitar la dependència o el
grau d’associació entre dues variables. Vegeu SÁNCHEZ CARRIÓN (1989).
[7] Variables emprades per MONTOYA com a factors són
l’estil (formal/informal) i municipi de procedència del parlant.
[8] Convé afegir que l’escala d’implicació dialectològica
s’assembla a l’escalograma de GUTTMAN. Així doncs, un càlcul que podem
recomanar, des d’ací, per a obtindre una mesura comparable del grau de
fiabilitat d’una escala implicativa és el seu Coeficient de Reproductivitat
(CR), en el qual es tenen en compte les discordàncies de les dades respecte a
la oepauta ideal de resposta”. Segons comunicació del doctor Antonio Alaminos un
escalograma de Guttman és fiablement unidimensional, és a dir, té un nivell
suficient de coherència interna, quan el seu CR és igual o superior a 0,90.
L’escala d’implicació elaborada per COLOMINA (1985, pàg. 121) té un CR de
0,8988, és a dir, des d’aquest punt de vista, està ben construïda. Val a dir
que per a les versions resumides d’aquesta escala d’implicació de COLOMINA
(1985, pàg. 119) llur CR és d’1, és a dir, són perfectes. El CR pot servir, per
exemple, perquè el dialectòleg prenga decisions sobre quines escales
d’implicació mereixen ésser publicades. I cal aconsellar que el càlcul del CR
acompanye, com a dada tècnica (a l’igual que tota enquesta seriosa va
acompanyada de la seua fitxa tècnica), les escales d’implicació que s’editen en
el futur.
[9] Cal afegir que COLOMINA (1985,pàg. 99) elabora la distribució d’una
variable dialectal segons l’edat i el sexe dels entrevistats, encara que la
mostra que pren només és de 16 persones. Per una altra banda, segons comunicació
personal sé que Vicent Beltran té previst realitzar escales d’implicació en la
seua tesis doctoral sobre el parlar de la Marina Alta.
[10] El Diccionari de sociologia del TERMCAT dóna una
definició incompleta del concepte oeanàlisi multivariable”, ja que s’hi ignora
l’existència de tècniques d’interdependència (vegeu pàg. 19 d’aqueix
diccionari).
[11] Per comunicació personal d’Eduard MIRA sé que en els
seus estudis de sociologia urbana parla de la similaritat entre els extrems o
finisterres dels eixos dels sistemes urbans europeus, qüestió que se sap
gràcies a l’aplicació de la tècnica del Cluster
analysis. Vegeu, per exemple, Eduard MIRA, oeOn States, Nations, Regions, Cities
and City-Systems”, dins Léonce BEKEMANS and Robert PICHT, European Societies between Diversity and Convergence, vol. II,
Brugge: College of Europe – European University Press, 1996, pàg. 116.
[12] Hi ha estudis sociològics fonamentats bàsicament en la
utilització d’un criteri de similaritat (llegiu: càlcul de distàncies), com per
exemple, el llibre coordinat per Antonio ALAMINOS, Prototipos electorales en la Comunidad Valenciana
(1977-1995), Alacant: Gamma, 1995, en el qual es determinen els municipis
arquetípics, des del punt de vista electoral, de cadascuna de les tres
circumscripcions electorals del País Valencià. L’equip que va realitzar aqueix
llibre, amb el qual va col·laborar qui açò escriu, fou l’únic equip de tota
Espanya que va encertar en el pronòstic dels resultats electorals de 1996
(vegeu periòdics La Verdad,
del 25-II-1996, pàg. 7, i del 5-III-1996, pàg. 16).
[13] Agraesc a l’amic Vicent BELTRAN que m’haja cedit les
informacions necessàries – que tant pacientment ha anat recollint al llarg
d’anys de treball de camp—per a confeccionar la matriu inicial de dades.
[15] Que la distància euclídia siga aproximada a 0 no vol
dir que estem davant de parlars locals idèntics, sinó que tenint en compte les
variables dialectològiques esmentades més amunt les diferències entre la
parella de casos són mínimes.
(article editat originalment a Sarrià. Revista
d'investigació i assaig de la comarca de la Marina, núm. 0; Callosa
d'en Sarrià: Organisme Autònom Administratiu Local de Cultura -OAALC- Salvà-Pérez Miralles, primavera de 1.998, pàgines
21-34)