Titre original :

A quantitative and qualitative corpus study of the acquisition of topic constructions in child French

Titre traduit :

Une analyse de corpus qualitative et quantitative de l'acquisition des constructions marquant le topique chez l'enfant français

Mots-clés en français :
  • Syntaxe
  • Structure de l'information
  • Acquisition du langage
  • Français

  • Acquisition du langage
Mots-clés en anglais :
  • Syntax
  • Information structure
  • Language acquisition
  • French

  • Langue : Anglais
  • Discipline : Sciences du langage
  • Identifiant : 2020LILUH026
  • Type de thèse : Doctorat
  • Date de soutenance : 13/11/2020

Résumé en langue originale

Cette recherche se donne pour objectif d’analyser l’interaction entre la syntaxe et la structure de l’information (SI) chez l’enfant français. Notre sujet d’étude est la dislocation, une construction indiquant le topique de la phrase (« ce sur quoi porte la phrase »). L’étude est basée sur l’analyse quantitative et qualitative d’un corpus transversal et d’un corpus longitudinal, et sur un modèle de régression logistique et un modèle multinomial. Nos données atteignent un total de 2181 dislocations gauche (1) et droite (2) (DG et DD), produites par 99 enfants entre 1;6 et 7 ans. En comparaison avec les analyses existantes sur les dislocations, il s’agit d’une base empirique très large.(1) Les chats ils font miaou. (Flavie, corpus TCOF, 6;1.4)(2) Où il est le papillon? (Marie, corpus Lyon, 2;1.13)Les principales contributions de cette étude sont les suivantes :1. Les enfants commencent à produire des dislocations avant deux ans, dès les premières productions d’énoncés à deux mots. Jusqu’à 3 ans, les enfants produisent plus de dislocations droite (DD) que de dislocations gauche (DG). A travers un modèle multinomial, nous montrons que la DG est plus fréquente lorsque les enfants produisent des énoncés moins elliptiques, ce qui soutient l’hypothèse que les constructions syntaxiques se développent à partir de la droite (Freudenthal et al., 2010).2. Les constituants disloqués ayant une fonction syntaxique à l’intérieur de la phrase apparaissent plus tôt que ceux n’ayant aucun lien syntaxique avec la phrase (Topiques suspendus), qui apparaissent à 6 ans. Les sujets disloqués apparaissent à 2 ans, un peu avant les objets disloqués (vers 2;6 ans). Dans nos données, les objets disloqués sont significativement plus souvent disloqués dans la périphérie droite, et les sujets disloqués dans la périphérie gauche : les enfants semblent donc sur-généraliser l’ordre des mots SVO (Diessel & Tomasello, 2005).3. Jusqu’à 5 ans, les pronoms sont plus souvent disloqués à gauche, et les syntagmes nominaux à droite. Notre hypothèse est que les syntagmes lexicaux sont plus difficiles à traiter cognitivement par l’enfant que les pronoms (Arnon, 2010). Dans les langues avec un ordre des mots SVO, les constituants ‘lourds’ sont produits en fin de phrase, ce qui pourrait expliquer que les syntagmes lexicaux soient produits dans des DDs chez l’enfant.4. Les enfants produisent des dislocations uniquement pour marquer le topique, et avec des référents actifs, désactivés, ou physiquement présents. Ainsi, comme chez l’adulte (Ashby, 1988), les enfants utilisent cette construction pour marquer le topique, et acquièrent tôt le fait que les topiques doivent être accessibles dans le contexte d’énonciation.5. A l’aide d’un modèle de régression logistique, nous montrons que, comme les adultes, les enfants produisent plus de topiques contrastifs dans les DGs que les DDs. Ils changent de topiques plus souvent avec des DGs, et maintiennent le topique avec des DDs.6. Nous avons testé l’hypothèse selon laquelle cette maîtrise de la SI dans les dislocations chez l’enfant est un effet de la production de constructions syntaxiques concrètes, avec des items lexicaux fixes, comme décrit par la théorie basée sur l’usage (Bannard & Lieven, 2009). Nous montrons que les premières tentatives de dislocation peuvent être décrites comme ayant des fonctions concrètes, comme exprimer la position ou le possesseur d’un objet. Ces fonctions sont elles-mêmes liées à des schémas syntaxiques spécifiques, comme Là X ou X ça. Ces résultats nous conduisent à formuler deux hypothèses (mutuellement exclusives) : (i) la dislocation n’est pas utilisée avec une fonction de marquage du topique dès le début, mais cette fonction se développe à partir de schémas précis ; ou (ii) le concept de topique est présent dès le début de l’acquisition du langage, mais il est d’abord réalisé de préférence à travers des schémas concrets, avec de se généraliser à d’autres contextes

Résumé traduit

In this PhD, we investigate the interaction between syntax and information structure (IS) in child French. Our case study is the analysis of dislocations, which are argued to indicate the topic of the sentence (“what the sentence is about”). The analysis is based on qualitative and quantitative corpus research in transversal and longitudinal corpora of spontaneous speech production and one logistic and two multinomial regression models. Our dataset consists of 2181 left (1) and right (2) dislocations (LD and RD) produced by 99 children between ages 1;6 and 7. In comparison with existing analyses of the acquisition of dislocation, this is a very large empirical basis.(1) Les chats ils font miaou. ‘Cats meow.’ (Flavie, corpus TCOF, 6;1.4)(2) Où il est le papillon? ‘Where’s the butterfly?’ (Marie, corpus Lyon, 2;1.13)The main goal of the present dissertation is to investigate the interaction between syntax and IS in first language acquisition in dislocation constructions, and determine whether syntax and IS develop simultaneously, or at different paces. The main contributions of this project to the field are the following:1. Dislocation appears before age 2, at the very beginning of the production of two-word utterances. Until age 3, children produce more right dislocations (RD) than left dislocations (LD). Through a multinomial regression model, we were able to show that LD becomes more frequent when they start producing less elliptic utterances, which supports the hypothesis that syntactic constructions are acquired from the right edge (Freudenthal et al., 2010).2. Dislocated constituents with a syntactic function within the sentence appear earlier than those with no syntactic link with the rest of the sentence (Hanging Topics), which appear from age 6. Dislocated subjects appear at age 2, before dislocated objects (at age 2;6). Our corpus data contain significantly more objects in RD than LD and more subjects in LD than in RD: children tend to overgeneralize the canonical SVO word order across constructions (Diessel & Tomasello, 2005).3. Until age 5, pronouns are dislocated more frequently to the left, and lexical NPs to the right. Our hypothesis is that children have more difficulties to process lexical NPs than pronouns (Arnon, 2010). Since heavy constituents in SVO languages tend to be produced in sentence-final positions (Arnold et al., 2000), French children dislocate lexical NPs to the right rather than to the left.4. Children produce dislocations to mark the topic, with active, deactivated, or physically present referents. This suggests that, like in adult language (Ashby, 1988), children use this construction to encode the topic and that they have acquired that topics must correspond to somehow accessible referents.5. Through a logistic regression model, we were able to show that, just as adults, children use significantly more contrastive topics in LD than RD. Moreover, continuing topics are dislocated significantly more frequently in the right periphery.6. We tested the hypothesis that the adult-like IS of dislocations by young children (age 2) is an effect of the production of item-based constructions with a low level of abstraction and fixed lexical items, as described by the usage-based literature on language development (Bannard & Lieven 2009). We found that early dislocations can be described in terms of concrete functions such as the expression of the location or possessor of an entity, which are associated with a specific syntactic constructional schema, such as Là X ‘There X’ or à X ça ‘to X that’. This finding prompts two new (mutually exclusive) hypotheses: (i) the concept of topic is not present at the onset of language acquisition, but develops from more concrete schemas; or (ii) the concept of topic is present at the onset of language acquisition, but is first preferably realized through concrete schemas and then spreads to more general aboutness-topic contexts

  • Directeur(s) de thèse : Canut, Emmanuelle - De Cat, Cécile - Lahousse, Karen
  • Président de jury : Goyens, Michèle
  • Membre(s) de jury : Canut, Emmanuelle - De Cat, Cécile - Lahousse, Karen - Clark, Eve V. - Dimroth, Christine - Lemmens, Maarten - De Stefani, Elwys - Soares, Carla
  • Rapporteur(s) : Clark, Eve V. - Dimroth, Christine
  • Laboratoire : Savoirs, textes, langage (Villeneuve d'Ascq, Nord)
  • École doctorale : École doctorale Sciences de l'homme et de la société (Lille ; 2006-....)

AUTEUR

  • Jourdain, Morgane
Droits d'auteur : Ce document est protégé en vertu du Code de la Propriété Intellectuelle.
Accès réservé à l'ensemble de la communauté universitaire