Normal view MARC view ISBD view

Dissecting the differential molecular signature in patients from african-origin with triple-negative breast cancer / Ana Teresa de Sousa e Menezes Matias ; orient. António Jacinto... [et al.]

Main Author Matias, Ana Teresa de Sousa e Menezes Secondary Author Jacinto, António
Cabral, Maria de Guadalupe
Braga, Sofia
Brito, Patrícia Homem de
Language Inglês. Country Portugal. Publication Lisboa : NOVA Medical School, Universidade NOVA de Lisboa , 2022 Description 235 p. : il. Dissertation Note or Thesis: Tese de Doutoramento
Biomedicina
2022
Faculdade de Ciências Médicas, Universidade NOVA de Lisboa
Abstract RESUMO:O cancro da mama (CM) é o cancro que ocorre mais frequentemente em mulheres e o segundo mais comum a nível mundial. Os CM englobam um grupo diverso de tumores, que são caracterizados por um amplo espetro de características clínicas, patológicas e moleculares. Esta ampla gama de fatores leva a disparidades na resposta a terapias por parte dos doentes. O principal determinante no prognóstico de um doente com CM é a expressão do recetor de estrogénio (RE), do recetor de progesterona (RP) e do Human Epidermal Growth Factor Receptor 2 (HER2). Doentes que apresentem estes biomarcadores têm terapias alvo específicas e um prognóstico mais favorável. No entanto, doentes que apresentem o subtipo de cancro da mama triplo-negativo (CMTN) não expressam os biomarcadores convencionais RE, RP e HER2, e são, por isso, “definidos negativamente”. Além disso, os CMTN são notavelmente inter- e intra-heterogéneos, e apresentam habitualmente um comportamento mais agressivo, com grandes lesões localmente avançadas ou desenvolvimento de metástases imediatamente após quimioterapia adjuvante. Assim, os CMTN são considerados um dos mais relevantes problemas médicos em CM e mulheres com este subtipo têm piores resultados clínicos do que doentes com outros subtipos de CM. Epidemiologicamente, o CMTN perfaz 10-20% dos casos globais de CM. No entanto, a prevalência e mortalidade do CMTN são mais elevadas em mulheres de ascendência africana, particularmente em doentes mais jovens. Mesmo quando considerando fatores socioeconómicos e independentemente de outros fatores de risco, mulheres de ascendência africana apresentam uma evolução mais rápida e agressiva do CMTN, comparativamente a doentes de outras populações. No entanto, os mecanismos moleculares envolvidos nesta discrepância associada à ancestralidade das doentes e relacionados com uma maior agressividade e idade mais jovem destas doentes ainda está pouco clarificado. A presente tese de doutoramento tem como objetivo principal desvendar os padrões transcriptómicos associados à ancestralidade de doentes de ascendência africana com CMTN, particularmente quando controlando para a condição menopáusica das doentes e para o estadio patológico da doença, e identificar vias de sinalização e reguladores de redes moleculares que estão potencialmente envolvidos na incidência mais elevada e agressividade do CMTN em mulheres de ascendência africana, comparando com doentes caucasianas. Começamos por explorar os dados clinicopatológicos de um grupo de doentes com CM composto por mulheres de ascendência africana e caucasiana, retirados do The Cancer Genome Atlas (TCGA), onde observámos uma incidência significativamente mais elevada de CMTN entre as doentes Afro-Americanas (AA). Considerando dados anteriormente publicados em como as doentes com CM de ascendência africana são diagnosticadas numa idade mais jovem e têm pior prognóstico, as doentes foram então agrupadas de acordo com a sua condição menopáusica e com o estadio patológico da doença. Curiosamente, observámos uma probabilidade de sobrevivência significativamente mais baixa especificamente em doentes AA no estado pré-menopáusico e com a doença no estadio II, quando comparando com as suas homólogas caucasianas. Estas observações levaram-nos a realizar análises de expressão génica diferencial (differential gene expression analysis - DGEA), usando dados de sequenciação de RNA, entre doentes AA com CMTN e doentes caucasianas, controlando para a condição menopáusica e/ou para o estadio patológico da doença. Notavelmente, e apesar de diferentes estudos sublinharem o facto de que doentes com CMTN e ascendência africana são diagnosticadas numa idade mais jovem, os nossos resultados sugerem que as diferenças no perfil de transcrição entre as duas populações são maiores quando controlando para o estadio patológico da doença do que quando controlando para a condição menopáusica da doente. Para excluir os genes diferencialmente expressos entre as duas populações que também o são em tecido mamário normal, realizamos uma DGEA comparando dados se sequenciação de RNA de tecido normal adjacente a CM de doentes AA e caucasianas do TCGA. Finalmente, também comparámos o perfil de expressão de CMTN e tecido mamário normal adjacente a CM de doentes AA, de modo a identificarmos alterações na expressão génica que o tecido mamário adquire para dar origem ao CMTN nesta população. Com milhares de genes diferencialmente expressos identificados nos diferentes grupos de doentes, os resultados da DGEA mostraram que, de facto, existe uma expressão génica diferencial associada à ancestralidade das doentes com CMTN. Posteriormente, efetuámos uma análise de enriquecimento de grupos de genes (Gene set enrichment analysis – GSEA), usando coleções de doenças e vias moleculares da Kyoto Encyclopedia of Genes and Genomes (KEGG), de modo a identificar vias de sinalização e processos biológicos alterados entre os diferentes grupos de doentes AA e caucasianas com CMTN, tendo em consideração a condição menopáusica e o estadio patológico da doença. Entre os grupos de genes enriquecidos, destacamos a via de sinalização Hippo como sendo a que está mais negativamente regulada nos seguintes grupos de doentes AA, comparando com doentes caucasianas: todos os CMTN, pós-menopausa, estadio II, e pós menopausa e estadio II. Esta regulação negative potencia a tumorigénese em doentes AA, uma vez que a regulação negativa da via de sinalização Hippo promove a transcrição de genes envolvidos na proliferação e competição celular, inibição da morte celular, transição epitélio-mesenquimal e formação de metástases. Adicionalmente, grupos de genes das coleções comunidade celular e motilidade celular estão também negativamente regulados em doentes AA dos grupos anteriormente mencionados, sugerindo que a integridade dos contactos célula-célula e que a organização do citoesqueleto de actina, fundamentais na homeostase do tecido epitelial, estarão enfraquecidos, promovendo a dissociação de células tumorais e subsequente surgimento de metástases, em concordância com o pior prognóstico destas doentes. Além disso, uma vez que o grupo Cancro da Mama, que inclui genes envolvidos no processo tumoral na mama, estão consistentemente regulados positivamente em doentes AA nas mesmas comparações, também sugerimos que estas doentes têm uma atividade aumentada de componentes e processos envolvidos no desenvolvimento do CM, que podem explicar a progressão mais rápida e a uma maior agressividade do CMTN nestas doentes. Finalmente, destacamos que a via de sinalização MAPK, responsável pela regulação de uma panóplia de processos celulares, incluindo proliferação, diferenciação, apoptose e respostas a stress, tendo um papel fundamental na sobrevivência e desenvolvimento das células cancerígenas, está positivamente regulada especificamente nas doentes AA que apresentam a doença no estadio II, sugerindo que esta via poderá contribuir para a discrepância observada relativamente à sobrevivência das doentes das duas populações diagnosticadas neste estadio da doença. De modo a identificar potenciais moléculas responsáveis pela discrepância associada à ancestralidade das doentes com CMTN, através do Ingenuity Pathway Analysis (IPA), realizámos uma análise com foco no design de redes moleculares, usando a lista completa de genes obtidos nas diferentes DGEA. As redes moleculares produzidas pelo IPA refletem um mapa de interações conhecidas entre as moléculas, onde redes moleculares altamente interconectadas são mais prováveis de representar alterações significativas nas funções biológicas e onde os reguladores centrais de cada rede molecular, i.e., genes diferencialmente expressos com mais ligações diretas e indiretas na sua rede, são potencialmente responsáveis pelas diferenças biológicas observadas entre as duas populações. O design das redes moleculares do IPA destacou o papel central do EGFR, do Myc e do Bcl2 nas diferenças transcriptómicas associadas à ancestralidade. Estas descobertas despertaram o nosso interesse pelas seguintes razões. O EGFR, descrito como promotor da proliferação, motilidade e sobrevivência celular através da ativação de várias vias de sinalização, incluindo as vias MAPK e PI3K AKT-mTOR, e sendo frequentemente descrito como estando superexpresso em vários tipos de cancro, incluindo o CMTN, está subexpresso nas doentes AA, quando comparando com doentes caucasiana homólogas. Este resultado está em linha com um estudo anterior, na qual a expressão de EGFR em CM e CMTN tem uma relação não-linear com o resultado da doença, sendo que uma expressão elevada ou diminuída do EGFR está associada a um pior resultado, comparando com os níveis intermédios de expressão. Assim, sugerimos que a baixa expressão de EGFR poderá promover um pior resultado especificamente nas doentes com CMTN de ascendência africana. O Myc, que está envolvido no crescimento celular, proliferação, metabolismo, diferenciação, vias de stress, resistência a fármacos e apoptose, e que é descrito como estando superexpresso em CMTN em estudos maioritariamente compostos por doentes de origem caucasiana ou linhas celulares, tem uma expressão génica ainda mais elevada nas doentes AA, o que poderá contribuir para uma pior evolução da doença neste grupo de doentes. Finalmente, o Bcl2, que é descrito como sendo um promotor da sobrevivência celular, está subexpresso especificamente nas doentes AA pré-menopáusicas. Em linha com estudos anteriores, a baixa expressão de Bcl2 em CMTN foi significativamente associada a uma proliferação mais elevada e a um aumento do risco de morte e recorrência. Notavelmente, também observámos uma subexpressão do BCL2 em CMTN comparativamente ao tecido normal adjacente ao CM em doentes AA, sugerindo que esta alteração na transcrição do gene poderá contribuir para o desenvolvimento de CMTN em doentes pré-menopáusicas de ascendência africana. Assim, selecionamos os candidatos EGFR, Myc e Bcl2 para a sua expressão ser validada em amostras de doentes com CMTN seguidas num hospital português, através de imunohistoquímica (IHC). Adicionalmente, também incluímos a β-Catenina nesta validação, sendo que anteriormente tínhamos observado que o seu gene se encontrava subexpresso em doentes AA pós-menopáusicas e diagnosticadas com a doença no estadio II. Decidimos incluir a β-Catenina devido ao número crescente de estudos sobre a via de sinalização Wnt/β-catenina como alvo terapêutico em vários tipos de tumores, bem como pelo facto de que a elevada expressão da β-catenina tem sido consensualmente descrita como sendo necessária para o desenvolvimento do CMTN através do controlo de várias propriedades tumorais, nomeadamente a migração, estaminalidade, crescimento celular e quimiossensibilidade. Notavelmente, apesar de a DGEA ter sido realizada usando dados de sequenciação de RNA de doentes dos EUA, e de para a IHC termos usado amostras de doentes de um hospital português, a expressão diferencial génica e proteica entre doentes de ascendência africana e doentes caucasianas originaram resultados equivalentes. Uma vez que a população AA tem predominantemente ascendência Niger-Kordofanian/África Ocidental, e a sendo que as doentes com ascendência africana seguidas em Portugal têm origem em países da África Ocidental, os nossos resultados sugerem que pelo menos as doentes com ancestralidade na África Ocidental, além de terem uma incidência mais elevada de CMTN, como descrito noutros estudos, também partilham algumas características moleculares associadas ao CMTN distintas das das doentes caucasianas. Assim, esta tese de doutoramento mostra uma nova perspetiva relativamente aos padrões de expressão génica do CMTN associados à ancestralidade de doentes de ascendência africana e caucasiana, particularmente quando considerando a condição menopáusica ou o estadio patológico da doença no diagnóstico. Particularmente, observamos que a expressão diferencial génica e proteica do EGFR, Myc, Bcl2 e β-catenina corresponde em populações de doentes geograficamente e culturalmente distintas, sugerindo que estes marcadores são indicadores importantes do desenvolvimento do CMTN associado à ancestralidade das doentes. Assim, esperamos que estas descobertas venham a ter um impacto significativo no prognóstico e nas opções terapêuticas especificas para doentes com ascendência africana diagnosticadas com CMTN.
ABSTRACT: Breast cancer (BC) is the most commonly occurring cancer in women and the second most common cancer worldwide. BCs comprise a diverse group of tumors, which are characterized by a wide spectrum of clinical, pathologic, and molecular features. This wide range of factors accounts for disparities in response to therapy and outcomes among patients. The main determinant for the prognosis of a BC patient is the expression of estrogen receptor (ER), progesterone receptor (PR) and Human Epidermal Growth Factor Receptor 2 (HER2). Patients presenting these biomarkers have specific targeted treatments and favorable prognosis. However, patients with the triple-negative breast cancer (TNBC) subtype do not express the conventional biomarkers ER, PR, and HER2, being “negatively defined”. Also, TNBCs are not only remarkably inter- and intra-heterogeneous, as they usually present a more aggressive behavior, with large locally advanced breast lesion or metastatic disease developing shortly after adjuvant chemotherapy. Thus, TNBC is considered one of the most relevant unmet medical problems in BC management and women with this subtype have worse outcome compared to other BC patients. Epidemiologically, TNBC comprises 10-20% of BC cases globally. Nonetheless, TNBC prevalence and mortality is higher in women of African-ancestry, particularly in younger patients. Even when accounting for socioeconomic factors and independently of other risk factors, African-ancestry patients present a faster and more aggressive clinical course of TNBC, comparing with other populations. However, Ancestry-specific molecular mechanisms involved in the increased aggressiveness and earlier age of onset of TNBC in Black-origin patients remain poorly clarified. The present PhD thesis aimed to unravel African ancestry-associated transcriptomic patterns in TNBC, particularly when controlling for menopause status or pathological staging, as well as to identify signaling pathways and network regulators potentially involved in the higher incidence and aggressiveness of TNBC in African-ancestry women in comparison with White women. We started by exploring the clinicopathological data from a group of BC patients comprised by African-ancestry and White women, from The Cancer Genome Atlas (TCGA), and observed a significantly higher TNBC incidence in the African-American (AA) group. Given the reported younger age of onset and poorer prognosis of African-ancestry BC cases, patients were then grouped according to their menopause status and pathological stage of the disease. Interestingly, we observed particularly in premenopausal and stage II disease a significantly lower survival probability of African American patients comparing with their White counterparts. These observations prompt us to perform differential gene expression analysis (DGEA), using RNA-sequencing data, between African-ancestry and White TNBC patients, controlling for the menopause status and/or pathological stage of the disease. Remarkably, despite studies consistently highlighting the earlier age of TNBC onset in African ancestry patients, our results suggest that differences in transcription profile between patients groups tend to be greater when controlling for disease’s pathological stage than when controlling for menopause status. To exclude the identified differences which can be observed in normal mammary tissue, we performed identical DGEA with RNA-sequencing data from normal-adjacent BC tissue from AA and White patients from TCGA. Finally, we also compared the expression profile of TNBCs and normal breast tissue from AA patients, to identify gene expression alterations that the breast tissue acquires in order to develop TNBC in this group of patients. With thousands of differentially expressed genes recovered among the different groups of patients, DGEA results showed that there are indeed gene expression ancestry-associated differences to justify TNBC’s epidemiological and clinical observations. Thus, we proceeded to refine DGEA results, in order to find potential leading molecules involved in the ancestry-associated TNBC discrepancy. Gene set enrichment analysis (GSEA), using collections of diseases and pathways from Kyoto Encyclopedia of Genes and Genomes (KEGG), was performed to identify altered pathways and biological processes between the different groups of AA and White patients, taking into account patients’ menopausal status and disease’s pathological stage. Among the enriched gene sets observed, we highlighted Hippo signaling pathway as the most downregulated gene set identified in AA patients, comparing with matching White patients, in the following established groups: all TNBC, postmenopausal, stage II, and postmenopausal/stage II. This downregulation is potentially promoting tumorigenesis in AA patients, since downregulation of Hippo pathway promotes the transcription of genes involved in cell proliferation and competition, cell death inhibition, epithelial-to-mesenchymal transition and tumor metastasis. Furthermore, gene sets from the cellular community and cell motility gene collections are also downregulated in AA patients from the previously mentioned groups, suggesting that the integrity of cell-cell contacts and actin cytoskeleton organization, fundamental in epithelial tissue homeostasis, are impaired, promoting tumor cells dissociation and subsequent metastasis, in agreement with the poorer prognosis of these patients. Also, since BC gene set, comprised by genes involved in the tumorigenic process in the breast, is consistently upregulated in AA patients in the same comparisons, we hypothesize that AA patients have a higher activation of components and processes involved in BC development, which may explain TNBC’s faster progression and aggressive behavior of these particular patients. Finally, we highlight that MAPK signaling pathway, which regulate a variety of cellular processes, including proliferation, differentiation, apoptosis and stress responses, playing a crucial role in the survival and development of cancer cells, is upregulated specifically in stage II disease AA patients,suggesting that this pathway may contribute to the observed discrepancy in the survival rate between the AA and White TNBC patients in this stage of the disease. To identify potential driving molecules involved in the ancestry-associated TNBC discrepancy, we also performed Ingenuity Pathway Analysis (IPA)’s core analysis with focus on network design, using the complete lists of genes obtained through DGEA. Networks in IPA produced a map of known interactions between molecules, where highly interconnected networks are likely to represent significantly altered biological functions and where central network regulators, i.e., differentially expressed genes with more direct and indirect connections in its network, are potential drivers for ancestry-associated biological differences. IPA’s network design highlighted a central role for EGFR, Myc and Bcl2 genes in discriminating differences in transcription profiles of AA and White TNBC patients. These findings triggered our interest for the following reasons. EGFR, which promote cell proliferation, motility, and survival, via activation of various downstream signaling pathways, including MAPK and PI3K-AKT-mTOR, and is frequently reported as overexpressed in several cancers, including TNBC, is downregulated in AA patients, comparing with matching White patients in our study. This result is in line with a previous report, in which EGFR expression in BC and TNBC has a nonlinear relation with disease outcome, with both lower and higher expression associated with worse outcome, compared to intermediate expression levels. Thus, we suggest that underexpression of EGFR may promote a worse outcome specifically in African-ancestry TNBC patients. Myc, which is involved in cell growth, proliferation, metabolism, differentiation, stress pathways, drug resistance and apoptosis, and is stated as being overexpressed in TNBC in studies mostly composed by White patients or cell lines, has here an even higher expression in the African-ancestry patients, which may contribute to the poorer outcome of this group of patients. Finally, Bcl2, which acts by promoting cell survival instead of driving cell proliferation, is downregulated specifically in premenopausal African-ancestry patients. In line with previous studies, Bcl2’s negative expression in TNBC was significantly associated with high proliferation and an increased risk of death and recurrence. Interestingly, BCL2 is also significantly downregulated in TNBC compared to normal-adjacent BC tissue in AAs, suggesting that this transcription impairment may contribute to TNBC development in premenopausal African-ancestry patients. Thus, we selected EGFR, Myc and Bcl2 for further validation in samples from a group of TNBC patients followed in a Portuguese hospital, through immunohistochemistry (IHC). Additionally, we also included β-Catenin in this validation, which we observed to be downregulated in AA patients presenting postmenopausal status and stage II disease, due to the crescent number of studies about Wnt/β-catenin signaling as a therapeutic target in many tumors, as well as because β-Catenin expression has been consensually reported as being required for TNBC development by controlling numerous tumor-associated properties, including migration, stemness, anchorage-independent growth and chemosensitivity. Remarkably, even though DGEA were performed with USA patients’ RNA-sequencing data and IHC in patients’ samples from a Portuguese hospital, gene and protein differential expression between African-ancestry and White patients show equivalent results. Since AA population is predominantly of Niger-Kordofanian/western Africa ancestry, and most of the African-ancestry patients followed in Portugal are from Western Africa countries, our results suggest that at least patients with Western Africa ancestry, besides having an higher incidence of TNBC, as reported in other studies, also share some TNBC-associated molecular features, distinct from White patients. Taken together, this PhD thesis provides novel insights into ancestry-associated gene expression patterns between African-ancestry and White TNBCs, particularly when controlling for patients’ menopause status or pathological stage of the disease at diagnosis. In particular, we observed that EGFR, Myc, Bcl2 and β-catenin gene and protein differential expression match in geographically and culturally distinct populations, suggesting these markers as being important indicators of TNBC’s ancestry-associated development. Thus, we expect that these findings have a significant impact in the prognosis and selection of therapeutic strategies specific for African-ancestry TNBC patients.
Topical name Breast Neoplasms
Sequence Analysis, RNA
Academic Dissertation
Africa
Online Resources Click here to access the eletronic resource http://hdl.handle.net/10362/137624
Tags from this library: No tags from this library for this title. Log in to add tags.
    average rating: 0.0 (0 votes)
Holdings
Item type Current location Call number url Status Date due Barcode
Documento Eletrónico Biblioteca NMS|FCM
online
RUN http://hdl.handle.net/10362/137624 Available 20220103

Tese de Doutoramento Biomedicina 2022 Faculdade de Ciências Médicas, Universidade NOVA de Lisboa

RESUMO:O cancro da mama (CM) é o cancro que ocorre mais frequentemente em mulheres e o segundo mais comum a nível mundial. Os CM englobam um grupo diverso de tumores, que são caracterizados por um amplo espetro de características clínicas, patológicas e moleculares. Esta ampla gama de fatores leva a disparidades na resposta a terapias por parte dos doentes. O principal determinante no prognóstico de um doente com CM é a expressão do recetor de estrogénio (RE), do recetor de progesterona (RP) e do Human Epidermal Growth Factor Receptor 2 (HER2). Doentes que apresentem estes biomarcadores têm terapias alvo específicas e um prognóstico mais favorável. No entanto, doentes que apresentem o subtipo de cancro da mama triplo-negativo (CMTN) não expressam os biomarcadores convencionais RE, RP e HER2, e são, por isso, “definidos negativamente”. Além disso, os CMTN são notavelmente inter- e intra-heterogéneos, e apresentam habitualmente um comportamento mais agressivo, com grandes lesões localmente avançadas ou desenvolvimento de metástases imediatamente após quimioterapia adjuvante. Assim, os CMTN são considerados um dos mais relevantes problemas médicos em CM e mulheres com este subtipo têm piores resultados clínicos do que doentes com outros subtipos de CM. Epidemiologicamente, o CMTN perfaz 10-20% dos casos globais de CM. No entanto, a prevalência e mortalidade do CMTN são mais elevadas em mulheres de ascendência africana, particularmente em doentes mais jovens. Mesmo quando considerando fatores socioeconómicos e independentemente de outros fatores de risco, mulheres de ascendência africana apresentam uma evolução mais rápida e agressiva do CMTN, comparativamente a doentes de outras populações. No entanto, os mecanismos moleculares envolvidos nesta discrepância associada à ancestralidade das doentes e relacionados com uma maior agressividade e idade mais jovem destas doentes ainda está pouco clarificado. A presente tese de doutoramento tem como objetivo principal desvendar os padrões transcriptómicos associados à ancestralidade de doentes de ascendência africana com CMTN, particularmente quando controlando para a condição menopáusica das doentes e para o estadio patológico da doença, e identificar vias de sinalização e reguladores de redes moleculares que estão potencialmente envolvidos na incidência mais elevada e agressividade do CMTN em mulheres de ascendência africana, comparando com doentes caucasianas. Começamos por explorar os dados clinicopatológicos de um grupo de doentes com CM composto por mulheres de ascendência africana e caucasiana, retirados do The Cancer Genome Atlas (TCGA), onde observámos uma incidência significativamente mais elevada de CMTN entre as doentes Afro-Americanas (AA). Considerando dados anteriormente publicados em como as doentes com CM de ascendência africana são diagnosticadas numa idade mais jovem e têm pior prognóstico, as doentes foram então agrupadas de acordo com a sua condição menopáusica e com o estadio patológico da doença. Curiosamente, observámos uma probabilidade de sobrevivência significativamente mais baixa especificamente em doentes AA no estado pré-menopáusico e com a doença no estadio II, quando comparando com as suas homólogas caucasianas. Estas observações levaram-nos a realizar análises de expressão génica diferencial (differential gene expression analysis - DGEA), usando dados de sequenciação de RNA, entre doentes AA com CMTN e doentes caucasianas, controlando para a condição menopáusica e/ou para o estadio patológico da doença. Notavelmente, e apesar de diferentes estudos sublinharem o facto de que doentes com CMTN e ascendência africana são diagnosticadas numa idade mais jovem, os nossos resultados sugerem que as diferenças no perfil de transcrição entre as duas populações são maiores quando controlando para o estadio patológico da doença do que quando controlando para a condição menopáusica da doente. Para excluir os genes diferencialmente expressos entre as duas populações que também o são em tecido mamário normal, realizamos uma DGEA comparando dados se sequenciação de RNA de tecido normal adjacente a CM de doentes AA e caucasianas do TCGA. Finalmente, também comparámos o perfil de expressão de CMTN e tecido mamário normal adjacente a CM de doentes AA, de modo a identificarmos alterações na expressão génica que o tecido mamário adquire para dar origem ao CMTN nesta população. Com milhares de genes diferencialmente expressos identificados nos diferentes grupos de doentes, os resultados da DGEA mostraram que, de facto, existe uma expressão génica diferencial associada à ancestralidade das doentes com CMTN. Posteriormente, efetuámos uma análise de enriquecimento de grupos de genes (Gene set enrichment analysis – GSEA), usando coleções de doenças e vias moleculares da Kyoto Encyclopedia of Genes and Genomes (KEGG), de modo a identificar vias de sinalização e processos biológicos alterados entre os diferentes grupos de doentes AA e caucasianas com CMTN, tendo em consideração a condição menopáusica e o estadio patológico da doença. Entre os grupos de genes enriquecidos, destacamos a via de sinalização Hippo como sendo a que está mais negativamente regulada nos seguintes grupos de doentes AA, comparando com doentes caucasianas: todos os CMTN, pós-menopausa, estadio II, e pós menopausa e estadio II. Esta regulação negative potencia a tumorigénese em doentes AA, uma vez que a regulação negativa da via de sinalização Hippo promove a transcrição de genes envolvidos na proliferação e competição celular, inibição da morte celular, transição epitélio-mesenquimal e formação de metástases. Adicionalmente, grupos de genes das coleções comunidade celular e motilidade celular estão também negativamente regulados em doentes AA dos grupos anteriormente mencionados, sugerindo que a integridade dos contactos célula-célula e que a organização do citoesqueleto de actina, fundamentais na homeostase do tecido epitelial, estarão enfraquecidos, promovendo a dissociação de células tumorais e subsequente surgimento de metástases, em concordância com o pior prognóstico destas doentes. Além disso, uma vez que o grupo Cancro da Mama, que inclui genes envolvidos no processo tumoral na mama, estão consistentemente regulados positivamente em doentes AA nas mesmas comparações, também sugerimos que estas doentes têm uma atividade aumentada de componentes e processos envolvidos no desenvolvimento do CM, que podem explicar a progressão mais rápida e a uma maior agressividade do CMTN nestas doentes. Finalmente, destacamos que a via de sinalização MAPK, responsável pela regulação de uma panóplia de processos celulares, incluindo proliferação, diferenciação, apoptose e respostas a stress, tendo um papel fundamental na sobrevivência e desenvolvimento das células cancerígenas, está positivamente regulada especificamente nas doentes AA que apresentam a doença no estadio II, sugerindo que esta via poderá contribuir para a discrepância observada relativamente à sobrevivência das doentes das duas populações diagnosticadas neste estadio da doença. De modo a identificar potenciais moléculas responsáveis pela discrepância associada à ancestralidade das doentes com CMTN, através do Ingenuity Pathway Analysis (IPA), realizámos uma análise com foco no design de redes moleculares, usando a lista completa de genes obtidos nas diferentes DGEA. As redes moleculares produzidas pelo IPA refletem um mapa de interações conhecidas entre as moléculas, onde redes moleculares altamente interconectadas são mais prováveis de representar alterações significativas nas funções biológicas e onde os reguladores centrais de cada rede molecular, i.e., genes diferencialmente expressos com mais ligações diretas e indiretas na sua rede, são potencialmente responsáveis pelas diferenças biológicas observadas entre as duas populações. O design das redes moleculares do IPA destacou o papel central do EGFR, do Myc e do Bcl2 nas diferenças transcriptómicas associadas à ancestralidade. Estas descobertas despertaram o nosso interesse pelas seguintes razões. O EGFR, descrito como promotor da proliferação, motilidade e sobrevivência celular através da ativação de várias vias de sinalização, incluindo as vias MAPK e PI3K AKT-mTOR, e sendo frequentemente descrito como estando superexpresso em vários tipos de cancro, incluindo o CMTN, está subexpresso nas doentes AA, quando comparando com doentes caucasiana homólogas. Este resultado está em linha com um estudo anterior, na qual a expressão de EGFR em CM e CMTN tem uma relação não-linear com o resultado da doença, sendo que uma expressão elevada ou diminuída do EGFR está associada a um pior resultado, comparando com os níveis intermédios de expressão. Assim, sugerimos que a baixa expressão de EGFR poderá promover um pior resultado especificamente nas doentes com CMTN de ascendência africana. O Myc, que está envolvido no crescimento celular, proliferação, metabolismo, diferenciação, vias de stress, resistência a fármacos e apoptose, e que é descrito como estando superexpresso em CMTN em estudos maioritariamente compostos por doentes de origem caucasiana ou linhas celulares, tem uma expressão génica ainda mais elevada nas doentes AA, o que poderá contribuir para uma pior evolução da doença neste grupo de doentes. Finalmente, o Bcl2, que é descrito como sendo um promotor da sobrevivência celular, está subexpresso especificamente nas doentes AA pré-menopáusicas. Em linha com estudos anteriores, a baixa expressão de Bcl2 em CMTN foi significativamente associada a uma proliferação mais elevada e a um aumento do risco de morte e recorrência. Notavelmente, também observámos uma subexpressão do BCL2 em CMTN comparativamente ao tecido normal adjacente ao CM em doentes AA, sugerindo que esta alteração na transcrição do gene poderá contribuir para o desenvolvimento de CMTN em doentes pré-menopáusicas de ascendência africana. Assim, selecionamos os candidatos EGFR, Myc e Bcl2 para a sua expressão ser validada em amostras de doentes com CMTN seguidas num hospital português, através de imunohistoquímica (IHC). Adicionalmente, também incluímos a β-Catenina nesta validação, sendo que anteriormente tínhamos observado que o seu gene se encontrava subexpresso em doentes AA pós-menopáusicas e diagnosticadas com a doença no estadio II. Decidimos incluir a β-Catenina devido ao número crescente de estudos sobre a via de sinalização Wnt/β-catenina como alvo terapêutico em vários tipos de tumores, bem como pelo facto de que a elevada expressão da β-catenina tem sido consensualmente descrita como sendo necessária para o desenvolvimento do CMTN através do controlo de várias propriedades tumorais, nomeadamente a migração, estaminalidade, crescimento celular e quimiossensibilidade. Notavelmente, apesar de a DGEA ter sido realizada usando dados de sequenciação de RNA de doentes dos EUA, e de para a IHC termos usado amostras de doentes de um hospital português, a expressão diferencial génica e proteica entre doentes de ascendência africana e doentes caucasianas originaram resultados equivalentes. Uma vez que a população AA tem predominantemente ascendência Niger-Kordofanian/África Ocidental, e a sendo que as doentes com ascendência africana seguidas em Portugal têm origem em países da África Ocidental, os nossos resultados sugerem que pelo menos as doentes com ancestralidade na África Ocidental, além de terem uma incidência mais elevada de CMTN, como descrito noutros estudos, também partilham algumas características moleculares associadas ao CMTN distintas das das doentes caucasianas. Assim, esta tese de doutoramento mostra uma nova perspetiva relativamente aos padrões de expressão génica do CMTN associados à ancestralidade de doentes de ascendência africana e caucasiana, particularmente quando considerando a condição menopáusica ou o estadio patológico da doença no diagnóstico. Particularmente, observamos que a expressão diferencial génica e proteica do EGFR, Myc, Bcl2 e β-catenina corresponde em populações de doentes geograficamente e culturalmente distintas, sugerindo que estes marcadores são indicadores importantes do desenvolvimento do CMTN associado à ancestralidade das doentes. Assim, esperamos que estas descobertas venham a ter um impacto significativo no prognóstico e nas opções terapêuticas especificas para doentes com ascendência africana diagnosticadas com CMTN.

ABSTRACT: Breast cancer (BC) is the most commonly occurring cancer in women and the second most common cancer worldwide. BCs comprise a diverse group of tumors, which are characterized by a wide spectrum of clinical, pathologic, and molecular features. This wide range of factors accounts for disparities in response to therapy and outcomes among patients. The main determinant for the prognosis of a BC patient is the expression of estrogen receptor (ER), progesterone receptor (PR) and Human Epidermal Growth Factor Receptor 2 (HER2). Patients presenting these biomarkers have specific targeted treatments and favorable prognosis. However, patients with the triple-negative breast cancer (TNBC) subtype do not express the conventional biomarkers ER, PR, and HER2, being “negatively defined”. Also, TNBCs are not only remarkably inter- and intra-heterogeneous, as they usually present a more aggressive behavior, with large locally advanced breast lesion or metastatic disease developing shortly after adjuvant chemotherapy. Thus, TNBC is considered one of the most relevant unmet medical problems in BC management and women with this subtype have worse outcome compared to other BC patients. Epidemiologically, TNBC comprises 10-20% of BC cases globally. Nonetheless, TNBC prevalence and mortality is higher in women of African-ancestry, particularly in younger patients. Even when accounting for socioeconomic factors and independently of other risk factors, African-ancestry patients present a faster and more aggressive clinical course of TNBC, comparing with other populations. However, Ancestry-specific molecular mechanisms involved in the increased aggressiveness and earlier age of onset of TNBC in Black-origin patients remain poorly clarified. The present PhD thesis aimed to unravel African ancestry-associated transcriptomic patterns in TNBC, particularly when controlling for menopause status or pathological staging, as well as to identify signaling pathways and network regulators potentially involved in the higher incidence and aggressiveness of TNBC in African-ancestry women in comparison with White women. We started by exploring the clinicopathological data from a group of BC patients comprised by African-ancestry and White women, from The Cancer Genome Atlas (TCGA), and observed a significantly higher TNBC incidence in the African-American (AA) group. Given the reported younger age of onset and poorer prognosis of African-ancestry BC cases, patients were then grouped according to their menopause status and pathological stage of the disease. Interestingly, we observed particularly in premenopausal and stage II disease a significantly lower survival probability of African American patients comparing with their White counterparts. These observations prompt us to perform differential gene expression analysis (DGEA), using RNA-sequencing data, between African-ancestry and White TNBC patients, controlling for the menopause status and/or pathological stage of the disease. Remarkably, despite studies consistently highlighting the earlier age of TNBC onset in African ancestry patients, our results suggest that differences in transcription profile between patients groups tend to be greater when controlling for disease’s pathological stage than when controlling for menopause status. To exclude the identified differences which can be observed in normal mammary tissue, we performed identical DGEA with RNA-sequencing data from normal-adjacent BC tissue from AA and White patients from TCGA. Finally, we also compared the expression profile of TNBCs and normal breast tissue from AA patients, to identify gene expression alterations that the breast tissue acquires in order to develop TNBC in this group of patients. With thousands of differentially expressed genes recovered among the different groups of patients, DGEA results showed that there are indeed gene expression ancestry-associated differences to justify TNBC’s epidemiological and clinical observations. Thus, we proceeded to refine DGEA results, in order to find potential leading molecules involved in the ancestry-associated TNBC discrepancy. Gene set enrichment analysis (GSEA), using collections of diseases and pathways from Kyoto Encyclopedia of Genes and Genomes (KEGG), was performed to identify altered pathways and biological processes between the different groups of AA and White patients, taking into account patients’ menopausal status and disease’s pathological stage. Among the enriched gene sets observed, we highlighted Hippo signaling pathway as the most downregulated gene set identified in AA patients, comparing with matching White patients, in the following established groups: all TNBC, postmenopausal, stage II, and postmenopausal/stage II. This downregulation is potentially promoting tumorigenesis in AA patients, since downregulation of Hippo pathway promotes the transcription of genes involved in cell proliferation and competition, cell death inhibition, epithelial-to-mesenchymal transition and tumor metastasis. Furthermore, gene sets from the cellular community and cell motility gene collections are also downregulated in AA patients from the previously mentioned groups, suggesting that the integrity of cell-cell contacts and actin cytoskeleton organization, fundamental in epithelial tissue homeostasis, are impaired, promoting tumor cells dissociation and subsequent metastasis, in agreement with the poorer prognosis of these patients. Also, since BC gene set, comprised by genes involved in the tumorigenic process in the breast, is consistently upregulated in AA patients in the same comparisons, we hypothesize that AA patients have a higher activation of components and processes involved in BC development, which may explain TNBC’s faster progression and aggressive behavior of these particular patients. Finally, we highlight that MAPK signaling pathway, which regulate a variety of cellular processes, including proliferation, differentiation, apoptosis and stress responses, playing a crucial role in the survival and development of cancer cells, is upregulated specifically in stage II disease AA patients,suggesting that this pathway may contribute to the observed discrepancy in the survival rate between the AA and White TNBC patients in this stage of the disease. To identify potential driving molecules involved in the ancestry-associated TNBC discrepancy, we also performed Ingenuity Pathway Analysis (IPA)’s core analysis with focus on network design, using the complete lists of genes obtained through DGEA. Networks in IPA produced a map of known interactions between molecules, where highly interconnected networks are likely to represent significantly altered biological functions and where central network regulators, i.e., differentially expressed genes with more direct and indirect connections in its network, are potential drivers for ancestry-associated biological differences. IPA’s network design highlighted a central role for EGFR, Myc and Bcl2 genes in discriminating differences in transcription profiles of AA and White TNBC patients. These findings triggered our interest for the following reasons. EGFR, which promote cell proliferation, motility, and survival, via activation of various downstream signaling pathways, including MAPK and PI3K-AKT-mTOR, and is frequently reported as overexpressed in several cancers, including TNBC, is downregulated in AA patients, comparing with matching White patients in our study. This result is in line with a previous report, in which EGFR expression in BC and TNBC has a nonlinear relation with disease outcome, with both lower and higher expression associated with worse outcome, compared to intermediate expression levels. Thus, we suggest that underexpression of EGFR may promote a worse outcome specifically in African-ancestry TNBC patients. Myc, which is involved in cell growth, proliferation, metabolism, differentiation, stress pathways, drug resistance and apoptosis, and is stated as being overexpressed in TNBC in studies mostly composed by White patients or cell lines, has here an even higher expression in the African-ancestry patients, which may contribute to the poorer outcome of this group of patients. Finally, Bcl2, which acts by promoting cell survival instead of driving cell proliferation, is downregulated specifically in premenopausal African-ancestry patients. In line with previous studies, Bcl2’s negative expression in TNBC was significantly associated with high proliferation and an increased risk of death and recurrence. Interestingly, BCL2 is also significantly downregulated in TNBC compared to normal-adjacent BC tissue in AAs, suggesting that this transcription impairment may contribute to TNBC development in premenopausal African-ancestry patients. Thus, we selected EGFR, Myc and Bcl2 for further validation in samples from a group of TNBC patients followed in a Portuguese hospital, through immunohistochemistry (IHC). Additionally, we also included β-Catenin in this validation, which we observed to be downregulated in AA patients presenting postmenopausal status and stage II disease, due to the crescent number of studies about Wnt/β-catenin signaling as a therapeutic target in many tumors, as well as because β-Catenin expression has been consensually reported as being required for TNBC development by controlling numerous tumor-associated properties, including migration, stemness, anchorage-independent growth and chemosensitivity. Remarkably, even though DGEA were performed with USA patients’ RNA-sequencing data and IHC in patients’ samples from a Portuguese hospital, gene and protein differential expression between African-ancestry and White patients show equivalent results. Since AA population is predominantly of Niger-Kordofanian/western Africa ancestry, and most of the African-ancestry patients followed in Portugal are from Western Africa countries, our results suggest that at least patients with Western Africa ancestry, besides having an higher incidence of TNBC, as reported in other studies, also share some TNBC-associated molecular features, distinct from White patients. Taken together, this PhD thesis provides novel insights into ancestry-associated gene expression patterns between African-ancestry and White TNBCs, particularly when controlling for patients’ menopause status or pathological stage of the disease at diagnosis. In particular, we observed that EGFR, Myc, Bcl2 and β-catenin gene and protein differential expression match in geographically and culturally distinct populations, suggesting these markers as being important indicators of TNBC’s ancestry-associated development. Thus, we expect that these findings have a significant impact in the prognosis and selection of therapeutic strategies specific for African-ancestry TNBC patients.

There are no comments for this item.

Log in to your account to post a comment.