The energy transition law passed by the French government has specific implications for renewable energies, in particular for their remuneration mechanism. Until 2015, a purchase obligation contract made it possible to sell electricity from wind power at a fixed rate. From 2015 onwards, some wind farms began to be exempted from the purchase obligation. This is because wind energy is starting to be sold directly on the market by the producers because of the breach of the purchase obligation contracts. Distribution system operators and transmission system operators require or even oblige producers to provide at least a production forecast one day in advance in order to rebalance the market. Over- or underestimation could be subject to penalties. There is, therefore, a huge need for accurate forecasts. It is in this context that this thesis was launched with the aim of proposing a model for predicting wind farms production by machine learning. We have production data and real wind measurements as well as data from meteorological models. We first compared the performances of the GFS and ECMWF models and studied the relationships between these two models through canonical correlation analysis. We then applied machine learning models to validate a first random forest prediction model. We then modeled the spatio-temporal wind dynamics and integrated it into the prediction model, which improved the prediction error by 3%. We also studied the selection of grid points by a variable group importance measure using random forests. Random forest prediction intervals associated with point forecasts of wind farm production are also studied. The forecasting model resulting from this work was developed to enable the ENGIE Group to have its own daily forecasts for all its wind farms. ; La loi de transition énergétique votée par l'Etat français a des implications précises sur les énergies renouvelables, en particulier sur leur mécanisme de rémunération. Jusqu'en 2015, un contrat d'obligation d'achat permettait de vendre ...
The energy transition law passed by the French government has specific implications for renewable energies, in particular for their remuneration mechanism. Until 2015, a purchase obligation contract made it possible to sell electricity from wind power at a fixed rate. From 2015 onwards, some wind farms began to be exempted from the purchase obligation. This is because wind energy is starting to be sold directly on the market by the producers because of the breach of the purchase obligation contracts. Distribution system operators and transmission system operators require or even oblige producers to provide at least a production forecast one day in advance in order to rebalance the market. Over- or underestimation could be subject to penalties. There is, therefore, a huge need for accurate forecasts. It is in this context that this thesis was launched with the aim of proposing a model for predicting wind farms production by machine learning. We have production data and real wind measurements as well as data from meteorological models. We first compared the performances of the GFS and ECMWF models and studied the relationships between these two models through canonical correlation analysis. We then applied machine learning models to validate a first random forest prediction model. We then modeled the spatio-temporal wind dynamics and integrated it into the prediction model, which improved the prediction error by 3%. We also studied the selection of grid points by a variable group importance measure using random forests. Random forest prediction intervals associated with point forecasts of wind farm production are also studied. The forecasting model resulting from this work was developed to enable the ENGIE Group to have its own daily forecasts for all its wind farms. ; La loi de transition énergétique votée par l'Etat français a des implications précises sur les énergies renouvelables, en particulier sur leur mécanisme de rémunération. Jusqu'en 2015, un contrat d'obligation d'achat permettait de vendre ...
The energy transition law passed by the French government has specific implications for renewable energies, in particular for their remuneration mechanism. Until 2015, a purchase obligation contract made it possible to sell electricity from wind power at a fixed rate. From 2015 onwards, some wind farms began to be exempted from the purchase obligation. This is because wind energy is starting to be sold directly on the market by the producers because of the breach of the purchase obligation contracts. Distribution system operators and transmission system operators require or even oblige producers to provide at least a production forecast one day in advance in order to rebalance the market. Over- or underestimation could be subject to penalties. There is, therefore, a huge need for accurate forecasts. It is in this context that this thesis was launched with the aim of proposing a model for predicting wind farms production by machine learning. We have production data and real wind measurements as well as data from meteorological models. We first compared the performances of the GFS and ECMWF models and studied the relationships between these two models through canonical correlation analysis. We then applied machine learning models to validate a first random forest prediction model. We then modeled the spatio-temporal wind dynamics and integrated it into the prediction model, which improved the prediction error by 3%. We also studied the selection of grid points by a variable group importance measure using random forests. Random forest prediction intervals associated with point forecasts of wind farm production are also studied. The forecasting model resulting from this work was developed to enable the ENGIE Group to have its own daily forecasts for all its wind farms. ; La loi de transition énergétique votée par l'Etat français a des implications précises sur les énergies renouvelables, en particulier sur leur mécanisme de rémunération. Jusqu'en 2015, un contrat d'obligation d'achat permettait de vendre ...
The energy transition law passed by the French government has specific implications for renewable energies, in particular for their remuneration mechanism. Until 2015, a purchase obligation contract made it possible to sell electricity from wind power at a fixed rate. From 2015 onwards, some wind farms began to be exempted from the purchase obligation. This is because wind energy is starting to be sold directly on the market by the producers because of the breach of the purchase obligation contracts. Distribution system operators and transmission system operators require or even oblige producers to provide at least a production forecast one day in advance in order to rebalance the market. Over- or underestimation could be subject to penalties. There is, therefore, a huge need for accurate forecasts. It is in this context that this thesis was launched with the aim of proposing a model for predicting wind farms production by machine learning. We have production data and real wind measurements as well as data from meteorological models. We first compared the performances of the GFS and ECMWF models and studied the relationships between these two models through canonical correlation analysis. We then applied machine learning models to validate a first random forest prediction model. We then modeled the spatio-temporal wind dynamics and integrated it into the prediction model, which improved the prediction error by 3%. We also studied the selection of grid points by a variable group importance measure using random forests. Random forest prediction intervals associated with point forecasts of wind farm production are also studied. The forecasting model resulting from this work was developed to enable the ENGIE Group to have its own daily forecasts for all its wind farms. ; La loi de transition énergétique votée par l'Etat français a des implications précises sur les énergies renouvelables, en particulier sur leur mécanisme de rémunération. Jusqu'en 2015, un contrat d'obligation d'achat permettait de vendre ...
The energy transition law passed by the French government has specific implications for renewable energies, in particular for their remuneration mechanism. Until 2015, a purchase obligation contract made it possible to sell electricity from wind power at a fixed rate. From 2015 onwards, some wind farms began to be exempted from the purchase obligation. This is because wind energy is starting to be sold directly on the market by the producers because of the breach of the purchase obligation contracts. Distribution system operators and transmission system operators require or even oblige producers to provide at least a production forecast one day in advance in order to rebalance the market. Over- or underestimation could be subject to penalties. There is, therefore, a huge need for accurate forecasts. It is in this context that this thesis was launched with the aim of proposing a model for predicting wind farms production by machine learning. We have production data and real wind measurements as well as data from meteorological models. We first compared the performances of the GFS and ECMWF models and studied the relationships between these two models through canonical correlation analysis. We then applied machine learning models to validate a first random forest prediction model. We then modeled the spatio-temporal wind dynamics and integrated it into the prediction model, which improved the prediction error by 3%. We also studied the selection of grid points by a variable group importance measure using random forests. Random forest prediction intervals associated with point forecasts of wind farm production are also studied. The forecasting model resulting from this work was developed to enable the ENGIE Group to have its own daily forecasts for all its wind farms. ; La loi de transition énergétique votée par l'Etat français a des implications précises sur les énergies renouvelables, en particulier sur leur mécanisme de rémunération. Jusqu'en 2015, un contrat d'obligation d'achat permettait de vendre ...
An attempt to study "styles of reasoning" specific to machine learning algorithms through their history and usages. Scientific usages in various disciplines are observed with some analysis of WebOfScience data. Engineering usages are observed with data from Kaggle and StackExchange. ; L'apprentissage artificiel, ou machine learning, est un ensemble de méthodes permettant d'établir, à partir de données, des modèles de prise de décision, de prédiction ou de classification. L' axiome plus général qui définirait ce champ de recherche est l'ambition de s'inspirer et d'imiter la capacité humaine et animale à apprendre de l'expérience. Les récents succès de ces méthodes - souvent relayés par des médias grand publics - sont seulement révélateurs de l'attention épisodique portée à des techniques qui remontent quant à elles à une cinquantaine d'années dans le contexte de l'Intelligence Artificielle et de l'informatique, et à plusieurs siècles de traditions scientifiques en mathématique, statistique, physique. Après avoir rendu compte de ces éléments, cette thèse s'intéresse aux différentes épistémès, "styles de pensée" qui rythment cette communauté, en étudiant les principaux algorithmes développés pour parvenir à la prise de décision, la prédiction ou la classification. Chacun des algorithmes est envisagé de manière historique mais aussi via les contraintes techniques et théoriques qu'il porte, et les compromis d'usages qu'il impose - par exemple entre interprétabilité et efficacité. Ces "tribus" de l'apprentissages apparaissent alors comme des tentatives relativement indépendantes de parvenir à un même objectif. Nous envisageons par la suite l'activité de ces sous-communautés algorithmiques dans le champ académique, par l'analyse de corpus bibliographiques extraits de Web of Science. La détection de communautés au sein des réseaux de co-citations construits à partir de ces données nous permet de mettre en lumière les structures thématiques transversales qui innervent les différents types d'algorithmes. Nous avons ainsi pu observer comment chaque discipline scientifique se place de manière spécifique dans le paysage algorithmique de l'apprentissage et entretient ou non des relations privilégiées avec les champs propres à sa recherche fondamentale. Il apparait donc, au terme de cette analyse, qu'il est plus facile pour un auteur de se mouvoir d'une thématique à une autre, que d'une méthode d'apprentissage à une autre. Enfin, nous nous intéressons à des terrains plus ingénieriques de la pratique de l'apprentissage avec une analyse de données issues des forums de questions-réponses Stackexchange et du site de compétitions en ligne Kaggle. On y retrouve plusieurs résultats proches de ceux observés dans le champ académique, comme les disciplines les plus représentées. De nettes différences émergent cependant quant à la diversité et la coprésence de ces algorithmes dans les compétitions et les usages des participants. En conclusion, nous mettons en perspective certains des éléments observés dans cette étude avec les récents débats sur la place de ces algorithmes dans les politiques publiques et discutons la question de leur nature discriminatoire.
This thesis focuses on model selection in Machine Learning from two points of view. The first part of the thesis focuses on relational kernel methods. Kernel methods hope to overcome the instances propositionalization, and to bridge the gap between relational and propositional problems. This thesis examines this objective in a particular case: the multiple instance problem, which is considered to be intermediate between relational and propositional problems. Concretely, we determine under which conditions the averaging kernel used for multiple instance problems, allows to reconstruct the target concept. This study follows the standard sketch of phase transition studies and relies on a new criterion to test the efficiency of of the propositionalization induced by the averaging kernel. The second part of the thesis focuses on feature selection. A solution to solve multiple instance problems, as presented in the first part, is to construct a propositionalization where each instance of the problem leads to a feature. This propositionalization constructs a huge number of features, which implies the need to look for a subset of features with only relevant features. Thus, the second part of the thesis presents a new framework for feature selection. Feature Selection is formalized as a Reinforcement Learning problem, leading to a provably optimal though intractable selection policy. This optimal policy is approximated, based on a one-player game approach and relying on the Monte-Carlo tree search UCT (Upper Confidence bound applied to Trees) proposed by Kocsis and Szepesvari (2006). The Feature Uct SElection (FUSE) algorithm extends UCT to deal with i) a finite unknown horizon (the target number of relevant features); ii) the huge branching factor of the search tree, reflecting the size of the feature set. Finally, a frugal reward function is proposed as a rough but unbiased estimate of the relevance of a feature subset. A proof of concept of FUSE is shown on benchmark data sets. ; Nous nous intéressons à la sélection de modèle en apprentissage automatique, sous deux angles différents. La première partie de la thèse concerne les méthodes à noyau relationnel. Les méthodes à noyau permettent en principe de s'affranchir de la représentation des instances, et de combler le fossé entre apprentissage relationnel et apprentissage propositionnel. Cette thèse s'intéresse à la faisabilité de cet objectif dans un cas particulier : les problèmes à instances multiples, qui sont considérés comme un intermédiaire entre les problèmes propositionnels et les problèmes relationnels. Concrètement, nous déterminons sous quelles conditions le noyau-somme, utilisé sur des problèmes à instances multiples, est en mesure de reconstruire le concept-cible. Cette étude suit le schéma standard des études de transition de phase et s'appuie sur un critère nouveau pour caractériser l'efficacité de la propositionnalisation induite par le noyau-somme. La deuxième partie de la thèse porte sur la sélection d'attributs. Une solution pour résoudre les problèmes à instances multiples, tels que présentés en première partie, passe par une propositionnalisation associant un attribut à chaque instance présente dans le problème. Le nombre d'attributs ainsi construits étant gigantesque, il est alors nécessaire de sélectionner un sous-ensemble d'attributs ne contenant que des attributs pertinents. La deuxième partie de la thèse propose donc une nouvelle approche pour la sélection d'attributs. La sélection d'attributs est réécrite comme un problème d'apprentissage par renforcement, conduisant ainsi à une politique de sélection optimale mais non-calculable en un temps raisonnable. Cette politique est approchée en se fondant sur une approche de jeu à un joueur et en utilisant la méthode Monte-Carlo pour les arbres UCT (Upper Confidence bound applied to Trees), qui a été proposée par Kocsis et Szepesvari (2006). L'algorithme FUSE (Feature Uct SElection) étend UCT pour gérer (1) l'horizon fini mais inconnu, et (2) le facteur de branchement élevé de l'arbre de recherche reflétant la taille de l'ensemble d'attributs. Finalement, une fonction de récompense frugale est proposée en tant qu'estimation grossière mais non-biaisée de la pertinence d'un sous-ensemble d'attributs. Une preuve de concept de FUSE est fournie sur des bases de données de référence.
With the democratization of connected devices equipped with GPS receivers, large quantities of vehicle trajectories become available, particularly via professional vehicle fleets, mobile navigation and collaborative driving applications. Recently, map inference techniques, aiming at deriving mapping information from these GPS tracks, have tended to complete or even replace traditional techniques. Initially restricted to the construction of road geometry, they are gradually being used to enrich existing networks, and in particular to build a digital database of road signs. Detailed and exhaustive knowledge of the infrastructure is an essential prerequisite in many areas : for network managers and decision-makers, for users with precise calculation of travel times, but also in the context of the autonomous vehicle, with the construction and updating of a high definition map providing in real time electronic horizons, which can supplement the system in the event of failures of the main sensors. In this context, statistical learning methods (e.g. Bayesian methods, random tree forests, neural networks,.) provide an interesting perspective and guarantee the adaptability of the approach to different use cases and the great variability of the data encountered in practice.In this thesis, we investigate the potential of this class of methods, for the automatic detection of traffic signals (mainly traffic lights), from a set of GPS speed profiles. First, we are working on an experimental, high-quality dataset, for which we compare the performances of several classifiers on classical image recognition approaches and on a functional approaches stemming from the field of signal processing, aggregating and decomposing speed profiles on a Haar wavelet basis whose coefficients are used as explanatory variables. The results obtained show the relevance of the functional approach, particularly when combined with the random forest algorithm, in terms of accuracy and computation time. The approach is then applied to other types of ...
Combining big data and machine learning algorithms, the power of automatic decision tools induces as much hope as fear. Many recently enacted European legislation (GDPR) and French laws attempt to regulate the use of these tools. Leaving aside the well-identified problems of data confidentiality and impediments to competition, we focus on the risks of discrimination , the problems of transparency and the quality of algorithmic decisions. The detailed perspective of the legal texts, faced with the complexity and opacity of the learning algorithms, reveals the need for important technological disruptions for the detection or reduction of the discrimination risk, and for addressing the right to obtain an explanation of the automatic decision. Since trust of the developers and above all of the users (citizens, litigants, customers) is essential, algorithms exploiting personal data must be deployed in a strict ethical framework. In conclusion, to answer this need, we list some ways of controls to be developed: institutional control, ethical charter, external audit attached to the issue of a label. ; Associant données massives (big data) et algorithmes d'apprentissage automatique (machine learning), la puissance des outils de décision automatique suscite autant d'espoir que de craintes. De nombreux textes législatifs européens (RGPD) et français récemment promulgués tentent d'encadrer les usages de ces outils. Laissant de côté les problèmes bien identifiés de confidentialité des données et ceux d'entrave à la concurrence, nous nous focalisons sur les risques de discrimination, les problèmes de transparence et ceux de qualité des décisions algorithmiques. La mise en perspective détaillée des textes juridiques, face à la complexité et l'opacité des algorithmes d'apprentissage, révèle la nécessité d'importantes disruptions technologiques que ce soit pour détecter ou réduire le risque de discrimination ou pour répondre au droit à l'explication. La confiance des développeurs et surtout des usagers (citoyens, justiciables, ...
Combining big data and machine learning algorithms, the power of automatic decision tools induces as much hope as fear. Many recently enacted European legislation (GDPR) and French laws attempt to regulate the use of these tools. Leaving aside the well-identified problems of data confidentiality and impediments to competition, we focus on the risks of discrimination , the problems of transparency and the quality of algorithmic decisions. The detailed perspective of the legal texts, faced with the complexity and opacity of the learning algorithms, reveals the need for important technological disruptions for the detection or reduction of the discrimination risk, and for addressing the right to obtain an explanation of the automatic decision. Since trust of the developers and above all of the users (citizens, litigants, customers) is essential, algorithms exploiting personal data must be deployed in a strict ethical framework. In conclusion, to answer this need, we list some ways of controls to be developed: institutional control, ethical charter, external audit attached to the issue of a label. ; Associant données massives (big data) et algorithmes d'apprentissage automatique (machine learning), la puissance des outils de décision automatique suscite autant d'espoir que de craintes. De nombreux textes législatifs européens (RGPD) et français récemment promulgués tentent d'encadrer les usages de ces outils. Laissant de côté les problèmes bien identifiés de confidentialité des données et ceux d'entrave à la concurrence, nous nous focalisons sur les risques de discrimination, les problèmes de transparence et ceux de qualité des décisions algorithmiques. La mise en perspective détaillée des textes juridiques, face à la complexité et l'opacité des algorithmes d'apprentissage, révèle la nécessité d'importantes disruptions technologiques que ce soit pour détecter ou réduire le risque de discrimination ou pour répondre au droit à l'explication. La confiance des développeurs et surtout des usagers (citoyens, justiciables, ...
Combining big data and machine learning algorithms, the power of automatic decision tools induces as much hope as fear. Many recently enacted European legislation (GDPR) and French laws attempt to regulate the use of these tools. Leaving aside the well-identified problems of data confidentiality and impediments to competition, we focus on the risks of discrimination , the problems of transparency and the quality of algorithmic decisions. The detailed perspective of the legal texts, faced with the complexity and opacity of the learning algorithms, reveals the need for important technological disruptions for the detection or reduction of the discrimination risk, and for addressing the right to obtain an explanation of the automatic decision. Since trust of the developers and above all of the users (citizens, litigants, customers) is essential, algorithms exploiting personal data must be deployed in a strict ethical framework. In conclusion, to answer this need, we list some ways of controls to be developed: institutional control, ethical charter, external audit attached to the issue of a label. ; Associant données massives (big data) et algorithmes d'apprentissage automatique (machine learning), la puissance des outils de décision automatique suscite autant d'espoir que de craintes. De nombreux textes législatifs européens (RGPD) et français récemment promulgués tentent d'encadrer les usages de ces outils. Laissant de côté les problèmes bien identifiés de confidentialité des données et ceux d'entrave à la concurrence, nous nous focalisons sur les risques de discrimination, les problèmes de transparence et ceux de qualité des décisions algorithmiques. La mise en perspective détaillée des textes juridiques, face à la complexité et l'opacité des algorithmes d'apprentissage, révèle la nécessité d'importantes disruptions technologiques que ce soit pour détecter ou réduire le risque de discrimination ou pour répondre au droit à l'explication. La confiance des développeurs et surtout des usagers (citoyens, justiciables, ...
Combining big data and machine learning algorithms, the power of automatic decision tools induces as much hope as fear. Many recently enacted European legislation (GDPR) and French laws attempt to regulate the use of these tools. Leaving aside the well-identified problems of data confidentiality and impediments to competition, we focus on the risks of discrimination , the problems of transparency and the quality of algorithmic decisions. The detailed perspective of the legal texts, faced with the complexity and opacity of the learning algorithms, reveals the need for important technological disruptions for the detection or reduction of the discrimination risk, and for addressing the right to obtain an explanation of the automatic decision. Since trust of the developers and above all of the users (citizens, litigants, customers) is essential, algorithms exploiting personal data must be deployed in a strict ethical framework. In conclusion, to answer this need, we list some ways of controls to be developed: institutional control, ethical charter, external audit attached to the issue of a label. ; Associant données massives (big data) et algorithmes d'apprentissage automatique (machine learning), la puissance des outils de décision automatique suscite autant d'espoir que de craintes. De nombreux textes législatifs européens (RGPD) et français récemment promulgués tentent d'encadrer les usages de ces outils. Laissant de côté les problèmes bien identifiés de confidentialité des données et ceux d'entrave à la concurrence, nous nous focalisons sur les risques de discrimination, les problèmes de transparence et ceux de qualité des décisions algorithmiques. La mise en perspective détaillée des textes juridiques, face à la complexité et l'opacité des algorithmes d'apprentissage, révèle la nécessité d'importantes disruptions technologiques que ce soit pour détecter ou réduire le risque de discrimination ou pour répondre au droit à l'explication. La confiance des développeurs et surtout des usagers (citoyens, justiciables, ...
Urban development can take different forms or features, depending on its geographical location and its socioeconomic, political and cultural context. Nevertheless, the overall action relies on one fundamental principle: building construction in order to give people housing. Therefore, the main objective of this research is to determine whether an underlying universal aspect of the urban development process can be distinguished from a specific one, being the reflect of local specificities. Specifically, this research analyzes the land use change on the French-German cross-border area. Indeed, the border context enhances the difference within this territory. Nonetheless, the internal European border importance as a separation is getting lower while European Union agreement and cooperation are getting stronger. Consequently, we tend to question a potential homogeneity of such area according the urban development analysis. To gain a better understanding of the urban development in the French-German cross-border area, a specific method using a decision tree (DT) process to generate and calibrate urban transition rules for cellular automata (CA) has been developed. In order to define CA rules, the learning algorithm is provided with data of land use, from 1990 and 2006, accessibility to the main urban area and country location. The findings demonstrate that the rule set identified rules, which are constrained at different levels: from the initial land use state needed for urbanization to the geographical location in a specific country. The analysis therefore shows rules specific to France or Germany, as well as rules free from any state location constraints, which characterize a cross-border urbanization process. The latter is more influenced by the location toward main urban areas. Proper neighborhood and internal characteristic of urbanized cells depending of the nature of the rule (French, German or Cross-border) are explicitly defined. In conclusion, this research contribution can be summarized according to the ...
Urban development can take different forms or features, depending on its geographical location and its socioeconomic, political and cultural context. Nevertheless, the overall action relies on one fundamental principle: building construction in order to give people housing. Therefore, the main objective of this research is to determine whether an underlying universal aspect of the urban development process can be distinguished from a specific one, being the reflect of local specificities. Specifically, this research analyzes the land use change on the French-German cross-border area. Indeed, the border context enhances the difference within this territory. Nonetheless, the internal European border importance as a separation is getting lower while European Union agreement and cooperation are getting stronger. Consequently, we tend to question a potential homogeneity of such area according the urban development analysis. To gain a better understanding of the urban development in the French-German cross-border area, a specific method using a decision tree (DT) process to generate and calibrate urban transition rules for cellular automata (CA) has been developed. In order to define CA rules, the learning algorithm is provided with data of land use, from 1990 and 2006, accessibility to the main urban area and country location. The findings demonstrate that the rule set identified rules, which are constrained at different levels: from the initial land use state needed for urbanization to the geographical location in a specific country. The analysis therefore shows rules specific to France or Germany, as well as rules free from any state location constraints, which characterize a cross-border urbanization process. The latter is more influenced by the location toward main urban areas. Proper neighborhood and internal characteristic of urbanized cells depending of the nature of the rule (French, German or Cross-border) are explicitly defined. In conclusion, this research contribution can be summarized according to the following three orientations: (1) from a theoretical point of view, which propose to identify urban processes degree of universality, (2) from a thematic outlook, describing the influence of the urban development process location on the border area, (3) from a methodological point of view, pairing DT and AC to automatically design and calibrate the urban development model used in this research work. ; Le développement urbain apparait distinct selon sa localisation géographique, le contexte socio-économique, politique ou culturel dans lequel il s'ancre. Néanmoins, l'action d'urbaniser s'appuie sur un seul et même principe : construire des bâtiments pour l'habitation et les activités humaines. Par conséquent, l'objectif principal de ce travail de recherche est de déterminer si une part universelle du processus de développement urbain peut se distinguer d'une part spécifique, liée à une localisation géographique. Cette recherche s'intéresse plus précisément aux changements d'occupation du sol sur la zone transfrontalière Franco-Allemande. En effet, le contexte transfrontalier renforce les différences au sein de la zone d'étude. Cependant, l'importance des frontières internes européennes en tant que séparation, a diminué parallèlement au renforcement des accords et de la coopération entre les pays membres de l'Union Européenne. Un questionnement sur le caractère éventuellement homogène de cette zone a ̀ travers l'étude des processus de développement urbain à l'œuvre, est donc d'autant plus pertinent. Pour une meilleure compréhension du processus de développement urbain, une méthode spécifique basée sur l'utilisation de l'apprentissage automatique par arbres de décision (AD) a été élaborée. Elle vise à générer et calibrer les règles de transition nécessaires a ̀ la simulation par automate cellulaire (AC). L'apprentissage s'appuie sur les caractéristiques d'occupation du sol dans le voisinage des cellules urbanisées entre 1990 et 2006, ainsi que sur les caractéristiques intrinsèques de ces cellules (accessibilité aux pôles urbains majeurs, localisation dans l'un ou l'autre des pays frontaliers). Les résultats obtenus par l'analyse du jeu de règles mettent en évidence une influence de la spécificité nationale et de l'occupation du sol initiale dans certaines règles. Cependant, il apparait qu'une part du processus s'affranchit de l'une comme de l'autre des contraintes, tendant ainsi à une plus grande universalité. Une analyse plus détaillée de ces règles permet ensuite de dégager des critères de voisinage et d'accessibilité influençant positivement de l'urbanisation de chaque cellule, et de comparer leur importance suivant la nature des règles analysées (françaises, allemandes, transfrontalières). En résumé, l'apport de cette thèse se mesure à trois niveaux : (1) d'un point de vue théorique en proposant d'identifier un degré d'universalité dans les processus de développement urbain ; (2) d'un point de vue thématique en caractérisant l'influence de la localisation du développement urbain dans une zone frontalière et (3) d'un point de vue méthodologique en développant un modèle sur la base d'un couplage AD – AC qui a permis de générer et calibré automatiquement le modèles utilisé pour simuler le développement urbain dans ce travail de recherche.
Urban development can take different forms or features, depending on its geographical location and its socioeconomic, political and cultural context. Nevertheless, the overall action relies on one fundamental principle: building construction in order to give people housing. Therefore, the main objective of this research is to determine whether an underlying universal aspect of the urban development process can be distinguished from a specific one, being the reflect of local specificities. Specifically, this research analyzes the land use change on the French-German cross-border area. Indeed, the border context enhances the difference within this territory. Nonetheless, the internal European border importance as a separation is getting lower while European Union agreement and cooperation are getting stronger. Consequently, we tend to question a potential homogeneity of such area according the urban development analysis. To gain a better understanding of the urban development in the French-German cross-border area, a specific method using a decision tree (DT) process to generate and calibrate urban transition rules for cellular automata (CA) has been developed. In order to define CA rules, the learning algorithm is provided with data of land use, from 1990 and 2006, accessibility to the main urban area and country location. The findings demonstrate that the rule set identified rules, which are constrained at different levels: from the initial land use state needed for urbanization to the geographical location in a specific country. The analysis therefore shows rules specific to France or Germany, as well as rules free from any state location constraints, which characterize a cross-border urbanization process. The latter is more influenced by the location toward main urban areas. Proper neighborhood and internal characteristic of urbanized cells depending of the nature of the rule (French, German or Cross-border) are explicitly defined. In conclusion, this research contribution can be summarized according to the following three orientations: (1) from a theoretical point of view, which propose to identify urban processes degree of universality, (2) from a thematic outlook, describing the influence of the urban development process location on the border area, (3) from a methodological point of view, pairing DT and AC to automatically design and calibrate the urban development model used in this research work. ; Le développement urbain apparait distinct selon sa localisation géographique, le contexte socio-économique, politique ou culturel dans lequel il s'ancre. Néanmoins, l'action d'urbaniser s'appuie sur un seul et même principe : construire des bâtiments pour l'habitation et les activités humaines. Par conséquent, l'objectif principal de ce travail de recherche est de déterminer si une part universelle du processus de développement urbain peut se distinguer d'une part spécifique, liée à une localisation géographique. Cette recherche s'intéresse plus précisément aux changements d'occupation du sol sur la zone transfrontalière Franco-Allemande. En effet, le contexte transfrontalier renforce les différences au sein de la zone d'étude. Cependant, l'importance des frontières internes européennes en tant que séparation, a diminué parallèlement au renforcement des accords et de la coopération entre les pays membres de l'Union Européenne. Un questionnement sur le caractère éventuellement homogène de cette zone a ̀ travers l'étude des processus de développement urbain à l'œuvre, est donc d'autant plus pertinent. Pour une meilleure compréhension du processus de développement urbain, une méthode spécifique basée sur l'utilisation de l'apprentissage automatique par arbres de décision (AD) a été élaborée. Elle vise à générer et calibrer les règles de transition nécessaires a ̀ la simulation par automate cellulaire (AC). L'apprentissage s'appuie sur les caractéristiques d'occupation du sol dans le voisinage des cellules urbanisées entre 1990 et 2006, ainsi que sur les caractéristiques intrinsèques de ces cellules (accessibilité aux pôles urbains majeurs, localisation dans l'un ou l'autre des pays frontaliers). Les résultats obtenus par l'analyse du jeu de règles mettent en évidence une influence de la spécificité nationale et de l'occupation du sol initiale dans certaines règles. Cependant, il apparait qu'une part du processus s'affranchit de l'une comme de l'autre des contraintes, tendant ainsi à une plus grande universalité. Une analyse plus détaillée de ces règles permet ensuite de dégager des critères de voisinage et d'accessibilité influençant positivement de l'urbanisation de chaque cellule, et de comparer leur importance suivant la nature des règles analysées (françaises, allemandes, transfrontalières). En résumé, l'apport de cette thèse se mesure à trois niveaux : (1) d'un point de vue théorique en proposant d'identifier un degré d'universalité dans les processus de développement urbain ; (2) d'un point de vue thématique en caractérisant l'influence de la localisation du développement urbain dans une zone frontalière et (3) d'un point de vue méthodologique en développant un modèle sur la base d'un couplage AD – AC qui a permis de générer et calibré automatiquement le modèles utilisé pour simuler le développement urbain dans ce travail de recherche.