Application Script Ollama 70B Local Excel

70B Model and 8B Model was used in order to do classifying tasks on 3200 cells in order to classify 1050 cells to 59 sectors. Data from Forbes Billionair list. As it is known that Billionairs have the better returns, this is a tool, the 30 year data to validate the evolution of billionairs and sectors. The goal being better informed and better overview over the Financial Market.

Run Script Microsoft Excel

The Code Handshake between Ollama and Excel as to be able to do local AI Excel in order to be using my M1 Max 64Gb 24C GPU 10C CPU in order to be able to let the AI do local AI on Excel and the ability to not use AI Credits.

Extract All world Stock data

1500 Companies >50 years Daily Interval

Export ALL data for : S&P500 , Nasdac100, Stoxx200, Stoxx50 , Brazil 57, CAC40 france , Daxx40 Germany, Spain 25, Taiwan 30, Mexico 35, Korea 80, FTSE100 UK , Japan 180 , Hongkong 400 , Indonesia 40 , Portugal 20 each company, 50 year data daiy level.
This generates CSV file of 1500x50x365 excel cells thus 27375000 CSV cells of which around 14million cells are filled.

Full World Rollup Program >900 lines own code

"""

Global Stock Data Extractor v2 — Multi-Country, 50-Year Daily Data

===================================================================

Key improvement in v2: COMPLETE manual ticker lists for every country.

Completeness > automation. The manual lists are the backbone; Wikipedia

auto-scrape is a bonus top-up. Previously found tickers persist via cache.

Countries covered (28):

USA, Germany, France, UK, Spain, Netherlands, Switzerland, Sweden,

Italy, Japan, Australia, Canada, Brazil, India, South Korea, Hong Kong,

Singapore, Denmark, Norway, Finland, Poland, South Africa, Belgium,

Portugal, Austria, Ireland, Mexico, New Zealand

"""

import pandas as pd

import yfinance as yf

import ssl

import urllib.request

import io

import json

import os

import time

import logging

from datetime import datetime

from concurrent.futures import ThreadPoolExecutor, as_completed

# ─── CONFIG ───────────────────────────────────────────────────────────────────

START_DATE = "1976-01-01"

END_DATE = datetime.today().strftime("%Y-%m-%d")

OUTPUT_DIR = "output"

CACHE_FILE = "ticker_cache.json"

MAX_WORKERS = 4

DOWNLOAD_CHUNK = 50

RETRY_ATTEMPTS = 3

RETRY_DELAY = 5

logging.basicConfig(level=logging.INFO, format="%(asctime)s %(levelname)s %(message)s")

log = logging.getLogger(__name__)

ssl._create_default_https_context = ssl._create_unverified_context

os.makedirs(OUTPUT_DIR, exist_ok=True)

# ─── EXCHANGE SUFFIX REGISTRY ─────────────────────────────────────────────────

EXCHANGE_SUFFIX = {

"DE": ".DE", "FR": ".PA", "GB": ".L", "ES": ".MC", "IT": ".MI",

"NL": ".AS", "BE": ".BR", "PT": ".LS", "SE": ".ST", "NO": ".OL",

"DK": ".CO", "FI": ".HE", "CH": ".SW", "AT": ".VI", "PL": ".WA",

"CZ": ".PR", "HU": ".BD", "GR": ".AT", "US": "", "CA": ".TO",

"BR": ".SA", "MX": ".MX", "AR": ".BA", "JP": ".T", "CN": ".SS",

"HK": ".HK", "KR": ".KS", "AU": ".AX", "NZ": ".NZ", "IN": ".NS",

"SG": ".SI", "TW": ".TW", "ZA": ".JO", "IL": ".TA", "SA": ".SR",

"AE": ".AD", "QA": ".QA",

}

def get_suffix(country_code: str) -> str:

return EXCHANGE_SUFFIX.get(country_code.upper(), "")

# ─── PERSISTENT TICKER CACHE ──────────────────────────────────────────────────

def load_cache() -> dict:

if os.path.exists(CACHE_FILE):

with open(CACHE_FILE, "r") as f:

return json.load(f)

return {}

def save_cache(cache: dict):

with open(CACHE_FILE, "w") as f:

json.dump(cache, f, indent=2)

def update_cache(index_name: str, tickers: list):

cache = load_cache()

existing = set(cache.get(index_name, []))

merged = sorted(existing | set(tickers))

cache[index_name] = merged

save_cache(cache)

log.info(f" Cache updated for {index_name}: {len(merged)} tickers stored")

return merged

def get_cached_tickers(index_name: str) -> list:

return load_cache().get(index_name, [])

# ─── WIKIPEDIA SCRAPING ───────────────────────────────────────────────────────

TICKER_COLUMN_CANDIDATES = [

"Ticker", "ticker", "Symbol", "symbol", "Code", "code",

"Ticker symbol", "Stock symbol", "ISIN", "Mnemonic",

"Abbreviation", "Short name", "Listing code", "EPIC",

]

def scrape_wikipedia_tickers(url: str, suffix: str, col_hints: list = None) -> list:

candidates = col_hints or TICKER_COLUMN_CANDIDATES

try:

req = urllib.request.Request(url, headers={"User-Agent": "Mozilla/5.0"})

with urllib.request.urlopen(req, timeout=15) as resp:

raw = resp.read()

tables = pd.read_html(io.BytesIO(raw))

tables_sorted = sorted(tables, key=len, reverse=True)

for table in tables_sorted[:5]:

for col in candidates:

if col in table.columns:

raw_tickers = table[col].dropna().astype(str).tolist()

tickers = []

for t in raw_tickers:

t = t.strip().split(" ")[0].replace(" ", "").replace("\xa0", "")

if t and not t.startswith("0") and len(t) <= 12:

tickers.append(t + suffix if not t.endswith(suffix) else t)

if tickers:

log.info(f" Wikipedia: found {len(tickers)} tickers via column '{col}'")

return tickers

log.warning(f" Wikipedia: no matching ticker column found in {url}")

except Exception as e:

log.warning(f" Wikipedia scrape failed: {e}")

return []

# ─── MARKET CAP RANKING ───────────────────────────────────────────────────────

def rank_by_market_cap(tickers: list) -> list:

log.info(f" Ranking {len(tickers)} tickers by market cap...")

cap_map = {}

for i in range(0, len(tickers), DOWNLOAD_CHUNK):

chunk = tickers[i : i + DOWNLOAD_CHUNK]

for t in chunk:

try:

fi = yf.Ticker(t).fast_info

cap = getattr(fi, "market_cap", None) or 0

if cap > 0:

cap_map[t] = cap

except Exception:

pass

time.sleep(0.5)

ranked = sorted(cap_map, key=cap_map.get, reverse=True)

unranked = [t for t in tickers if t not in cap_map]

log.info(f" Ranked: {len(ranked)} valid | Skipped (no cap data): {len(unranked)}")

return ranked + unranked

# ─── DOWNLOAD WITH RETRY ──────────────────────────────────────────────────────

def download_with_retry(tickers: list, start: str, end: str) -> pd.DataFrame:

for attempt in range(1, RETRY_ATTEMPTS + 1):

try:

data = yf.download(tickers, start=start, end=end,

auto_adjust=True, progress=False, threads=True)

close = data["Close"] if isinstance(data.columns, pd.MultiIndex) else data

return close

except Exception as e:

log.warning(f" Download attempt {attempt} failed: {e}")

if attempt < RETRY_ATTEMPTS:

time.sleep(RETRY_DELAY * attempt)

log.error(" All download attempts failed.")

return pd.DataFrame()

# ─── MAIN EXTRACTOR ───────────────────────────────────────────────────────────

def extract_country_data(job: dict):

country = job["country"]

index_name = job["index_name"]

suffix = get_suffix(job.get("country_code", ""))

log.info(f"\n{'='*60}\nPROCESSING: {country} — {index_name}")

cached = get_cached_tickers(index_name)

log.info(f" Cache: {len(cached)} previously known tickers")

auto = []

if job.get("url"):

auto = scrape_wikipedia_tickers(job["url"], suffix, job.get("cols"))

manual = job.get("manual", [])

combined = list(set(cached) | set(auto) | set(manual))

log.info(f" Combined (cached + auto + manual): {len(combined)} unique tickers")

combined = update_cache(index_name, combined)

ranked = rank_by_market_cap(combined)

log.info(f" Downloading data for {len(ranked)} tickers ({START_DATE} → {END_DATE})...")

close_df = download_with_retry(ranked, START_DATE, END_DATE)

if close_df.empty:

log.error(f" No data returned for {index_name}. Skipping export.")

return

available = [t for t in ranked if t in close_df.columns]

close_df = close_df[available]

df_wide = close_df.transpose()

df_wide.columns = pd.to_datetime(df_wide.columns).strftime("%Y-%m-%d")

filename = os.path.join(OUTPUT_DIR, f"{country}_{index_name}_{len(available)}_tickers.csv")

df_wide.to_csv(filename)

log.info(f" ✓ Saved: {filename} ({df_wide.shape[0]} tickers × {df_wide.shape[1]} days)")

# ═══════════════════════════════════════════════════════════════════════════════

# COUNTRY JOB LIBRARY — COMPLETE MANUAL TICKER LISTS

# ═══════════════════════════════════════════════════════════════════════════════

COUNTRY_JOBS = [

# ══════════════════════════════════════════════════════════════

# USA — S&P 500 (503 constituents)

# ══════════════════════════════════════════════════════════════

{

"country": "USA",

"country_code": "US",

"index_name": "SP500",

"url": "https://en.wikipedia.org/wiki/List_of_S%26P_500_companies",

"cols": ["Symbol"],

"manual": [

"AAPL","MSFT","NVDA","AMZN","META","GOOGL","GOOG","BRK-B","LLY","JPM",

"V","UNH","XOM","TSLA","MA","AVGO","PG","JNJ","COST","HD","MRK","ABBV",

"CVX","CRM","BAC","NFLX","KO","WMT","AMD","PEP","TMO","ORCL","CSCO",

"ACN","MCD","ABT","WFC","LIN","DHR","TXN","IBM","PM","QCOM","NEE","INTU",

"DIS","CAT","GE","RTX","SPGI","HON","VZ","AMGN","AMAT","BKNG","AXP",

"LOW","ISRG","GS","SYK","BLK","T","PLD","MDT","VRTX","ELV","C","ADI",

"DE","REGN","MMC","CI","GILD","SCHW","PGR","TJX","MO","BSX","CME","CB",

"KLAC","LRCX","EOG","SO","SLB","MU","MDLZ","ETN","NOC","ITW","ICE",

"ZTS","ADP","HCA","MMM","DUK","BDX","COP","AON","EW","APD","TGT","NSC",

"EMR","ROP","SHW","GD","USB","PH","CTAS","GM","WELL","MCO","WM","MSI",

"PSA","PCAR","FCX","ECL","NKE","F","CARR","D","OKE","FICO","AIG","MCK",

"MAR","COF","APH","FDX","ORLY","SPG","FTNT","HLT","CCI","PNC","AFL",

"NXPI","TDG","CSX","IDXX","TFC","FAST","MNST","HES","KMB","ROST","AZO",

"EXC","DHI","VRSK","GWW","DOW","CSGP","CTVA","CMG","A","MSCI","HUM",

"TEL","EBAY","SRE","PAYX","NUE","OTIS","KDP","CPRT","GEHC","PCG","ALL",

"KR","YUM","VICI","DLTR","GIS","PRU","AEP","PWR","MPWR","AME","EA",

"ODFL","DXCM","ACGL","HSY","BIIB","O","ROK","BAX","ED","SYY","DAL",

"HIG","STZ","LH","CTSH","WEC","SBUX","TROW","IQV","ANSS","KHC","XEL",

"CNC","PPG","KEYS","WST","TSCO","DVN","EIX","AWK","MTD","ULTA","MCHP",

"HOLX","FIS","TTWO","CDNS","VLO","BALL","LMT","MKC","WAT","IT","HPQ",

"FITB","MTB","ES","PPL","DTE","RMD","EFX","CHD","ZBRA","RF","DOV","LUV",

"IFF","HRL","TRMB","EG","BR","STT","OMC","CAH","INVH","WBA","PFG",

"STE","IP","CLX","FTV","ARE","IEX","CINF","EXPD","LVS","FSLR","HWM",

"PKG","POOL","CTRA","TER","HAL","SWKS","CF","LYB","GLW","NTAP","AKAM",

"TPR","JKHY","EMN","ENPH","CHRW","WRB","DPZ","BF-B","K","AVY","MOS",

"CPT","AIZ","ALLE","AOS","BWA","CPB","MHK","HSIC","JNPR","NWSA","NWS",

"LNC","PNR","RL","DVA","FMC","HII","IRM","L","AAL","NCLH","CCL","RCL",

"MGM","WYNN","LW","TAP","GPS","PVH","HAS","HA","UHS","CRL","WRK","VTRS",

"CAG","SJM","TFSL","CF","DISH","PENN","NRG","AES","DXC","FOX","FOXA",

"UA","UAA","AAP","BBWI","BEN","CTLT","CE","MNK","PRGO","RHI","SEE",

"XRX","ZION","VFC","WU","DISCA","DISCB","DISCK","NLSN","RE","APA",

],

},

# ══════════════════════════════════════════════════════════════

# GERMANY — DAX 40

# ══════════════════════════════════════════════════════════════

{

"country": "Germany",

"country_code": "DE",

"index_name": "DAX40",

"url": "https://en.wikipedia.org/wiki/DAX",

"cols": ["Ticker", "Symbol"],

"manual": [

"SAP.DE","SIE.DE","ALV.DE","AIR.DE","MRK.DE","DTE.DE","BMW.DE","MBG.DE",

"BAS.DE","BAYN.DE","ADS.DE","IFX.DE","ENR.DE","RWE.DE","VNA.DE","HEN3.DE",

"MTX.DE","EOAN.DE","HEI.DE","DBK.DE","FRE.DE","DPW.DE","HNR1.DE","LHA.DE",

"CON.DE","MAN.DE","VOW3.DE","PAH3.DE","P911.DE","ZAL.DE","QIA.DE","SHL.DE",

"DHER.DE","SY1.DE","AFX.DE","SDAX.DE","MDAX.DE","1COV.DE","BEI.DE","DB1.DE",

"WDI.DE","FME.DE","RNL.DE","COP.DE","PUM.DE","HAB.DE","TKA.DE","RAA.DE",

"EVK.DE","KGX.DE","OSB.DE","KWS.DE","HLAG.DE","NDX1.DE","NDA.DE","PSM.DE",

"SRT.DE","TAG.DE","EVD.DE","BOSS.DE","AIXA.DE","ARND.DE","BC8.DE","CAP.DE",

],

},

# ══════════════════════════════════════════════════════════════

# FRANCE — CAC 40 + SBF 120 extras

# ══════════════════════════════════════════════════════════════

{

"country": "France",

"country_code": "FR",

"index_name": "CAC40",

"url": "https://en.wikipedia.org/wiki/CAC_40",

"cols": ["Ticker", "Symbol"],

"manual": [

"MC.PA","OR.PA","TTE.PA","SAN.PA","AIR.PA","BNP.PA","KER.PA","SU.PA",

"RI.PA","CAP.PA","EL.PA","CS.PA","ACA.PA","ORA.PA","VIE.PA","AI.PA",

"DG.PA","EN.PA","BN.PA","SGO.PA","VIV.PA","ATO.PA","AC.PA","DSY.PA",

"STM.PA","WLN.PA","HO.PA","RNO.PA","URW.PA","ML.PA","ENGI.PA","LR.PA",

"ERF.PA","STLAP.PA","FTI.PA","BOL.PA","SK.PA","SOLB.PA","AMUN.PA",

"EDF.PA","FP.PA","GLE.PA","LHN.PA","PUB.PA","RMS.PA","SAF.PA","SW.PA",

"SOP.PA","TEP.PA","TFI.PA","UBI.PA","VLTSA.PA","CAT.PA","DBV.PA",

"EDEN.PA","FDJ.PA","GTT.PA","HEX.PA","IPN.PA","LI.PA","NEX.PA","OVH.PA",

],

},

# ══════════════════════════════════════════════════════════════

# UK — FTSE 100

# ══════════════════════════════════════════════════════════════

{

"country": "UK",

"country_code": "GB",

"index_name": "FTSE100",

"url": "https://en.wikipedia.org/wiki/FTSE_100_Index",

"cols": ["Ticker", "EPIC", "Symbol"],

"manual": [

"SHEL.L","AZN.L","HSBA.L","ULVR.L","BP.L","RIO.L","GSK.L","LSEG.L",

"NG.L","DGE.L","BARC.L","LLOY.L","STAN.L","BATS.L","REL.L","BA.L",

"EXPN.L","HLN.L","IMB.L","ABF.L","FLTR.L","WPP.L","MNG.L","OCDO.L",

"SKG.L","AUTO.L","CNA.L","NXT.L","RKT.L","SGRO.L","TSCO.L","VOD.L",

"WTB.L","AAL.L","ADM.L","AGK.L","AHT.L","ANTO.L","AV.L","AVV.L","AW.L",

"AZN.L","BBOX.L","BKG.L","BLND.L","BME.L","BNC.L","BNZL.L","BOO.L",

"BRBY.L","BT.L","CCH.L","CRDA.L","CPG.L","DCC.L","DPLM.L","EZJ.L",

"FRAS.L","GLEN.L","HIK.L","HLMA.L","HMS.L","HVPE.L","IAG.L","IHG.L",

"III.L","INF.L","ITRK.L","ITV.L","JD.L","JET.L","KGF.L","LAND.L",

"LMP.L","LGEN.L","LOGN.L","MKS.L","MNDI.L","MRO.L","NWG.L","NXT.L",

"PCT.L","PFC.L","PHX.L","POLY.L","PSN.L","PSON.L","REX.L","RR.L",

"RS1.L","RSA.L","SDR.L","SGE.L","SJP.L","SMT.L","SMWH.L","SN.L",

"SVT.L","TW.L","UU.L","VTY.L","WEIR.L","WH.L","WHR.L","XP.L",

],

},

# ══════════════════════════════════════════════════════════════

# SPAIN — IBEX 35

# ══════════════════════════════════════════════════════════════

{

"country": "Spain",

"country_code": "ES",

"index_name": "IBEX35",

"url": "https://en.wikipedia.org/wiki/IBEX_35",

"cols": ["Ticker", "Symbol"],

"manual": [

"ITX.MC","SAN.MC","BBVA.MC","IBE.MC","REP.MC","CABK.MC","TEF.MC",

"ACS.MC","AENA.MC","CLNX.MC","FER.MC","GRF.MC","IAG.MC","MAP.MC",

"MEL.MC","MTS.MC","NTGY.MC","RED.MC","SAB.MC","SGRE.MC","SLR.MC",

"SOLARIA.MC","UNI.MC","VIS.MC","ACX.MC","AMS.MC","ANA.MC","BKT.MC",

"CAF.MC","COL.MC","ENG.MC","FCC.MC","FLUIDRA.MC","LOG.MC","PHM.MC",

],

},

# ══════════════════════════════════════════════════════════════

# NETHERLANDS — AEX 25

# ══════════════════════════════════════════════════════════════

{

"country": "Netherlands",

"country_code": "NL",

"index_name": "AEX25",

"url": "https://en.wikipedia.org/wiki/AEX_index",

"cols": ["Ticker", "Symbol"],

"manual": [

"ASML.AS","SHELL.AS","ADYEN.AS","NN.AS","PHIA.AS","UNA.AS","WKL.AS",

"HEIA.AS","ABN.AS","AGN.AS","AKZA.AS","ASM.AS","BESI.AS","DSM.AS",

"EXOR.AS","IMCD.AS","INGA.AS","KPN.AS","MT.AS","RAND.AS","REN.AS",

"SBM.AS","URW.AS","VPK.AS","WDP.AS","AALB.AS","AMG.AS","ARCAD.AS",

"BAMNB.AS","BEKB.AS","FLOW.AS","GLPG.AS","HAL.AS","HEIJM.AS","NSI.AS",

"OCI.AS","ORDINA.AS","OVS.AS","PHARM.AS","POST.AS","SIGNIFY.AS",

"TOM2.AS","TKWY.AS","TOM2.AS","VAST.AS","VMOB.AS","WEX.AS",

],

},

# ══════════════════════════════════════════════════════════════

# SWITZERLAND — SMI 20 + extras

# ══════════════════════════════════════════════════════════════

{

"country": "Switzerland",

"country_code": "CH",

"index_name": "SMI20",

"url": "https://en.wikipedia.org/wiki/Swiss_Market_Index",

"cols": ["Ticker", "Symbol"],

"manual": [

"NESN.SW","ROG.SW","NOVN.SW","UHR.SW","ZURN.SW","UBSG.SW","CFR.SW",

"GIVN.SW","ABBN.SW","LONN.SW","ALC.SW","PGHN.SW","SREN.SW","SLHN.SW",

"GEBN.SW","SIKA.SW","TEMN.SW","UREN.SW","SCMN.SW","BALN.SW","CSGN.SW",

"CLTN.SW","DKSH.SW","EFGN.SW","EMMN.SW","FTON.SW","GAM.SW","HELN.SW",

"HOLN.SW","IDIA.SW","IMPN.SW","IREN.SW","JBZG.SW","JUBN.SW","KARN.SW",

"KNIN.SW","LECN.SW","LISP.SW","LSCC.SW","MBTN.SW","MOBN.SW","ORON.SW",

"PATN.SW","PSPN.SW","SCHP.SW","SGSN.SW","SIGN.SW","SRAIL.SW","STMN.SW",

"SWON.SW","SYNN.SW","TECN.SW","TIBN.SW","VPAS.SW","VZUG.SW","WKBN.SW",

],

},

# ══════════════════════════════════════════════════════════════

# SWEDEN — OMXS30 + large caps

# ══════════════════════════════════════════════════════════════

{

"country": "Sweden",

"country_code": "SE",

"index_name": "OMXS30",

"url": "https://en.wikipedia.org/wiki/OMX_Stockholm_30",

"cols": ["Ticker", "Symbol"],

"manual": [

"ERIC-B.ST","VOLV-B.ST","ATCO-A.ST","SWED-A.ST","SEB-A.ST","SAND.ST",

"SKF-B.ST","SHB-A.ST","AZN.ST","ALFA.ST","ALIV-SDB.ST","ASSA-B.ST",

"ATCO-B.ST","ATLET-B.ST","BOL.ST","CAST.ST","ELUX-B.ST","EPIROC-A.ST",

"ESSITY-A.ST","ESSITY-B.ST","EVO.ST","GETI-B.ST","HEXA-B.ST","HM-B.ST",

"HMS.ST","HUFV-A.ST","IAR.ST","INDU-A.ST","INV-B.ST","KINV-B.ST",

"LATO-B.ST","LIF-B.ST","LOOMIS.ST","LVMH.ST","NIBE-B.ST","NDA-SE.ST",

"NOKIA-SEK.ST","NWG.ST","PEAB-B.ST","SAAB-B.ST","SCA-B.ST","SCAB.ST",

"SECUB.ST","SECU-B.ST","SKA-B.ST","SSAB-A.ST","SSAB-B.ST","SS.ST",

"STERV.ST","STM.ST","SWED-B.ST","TELE2-B.ST","TELIA.ST","THULE.ST",

"TOBII.ST","TREL-B.ST","VITR.ST","VOLV-A.ST","WALL-B.ST","WLKN.ST",

],

},

# ══════════════════════════════════════════════════════════════

# ITALY — FTSE MIB 40

# ══════════════════════════════════════════════════════════════

{

"country": "Italy",

"country_code": "IT",

"index_name": "FTSE_MIB",

"url": "https://en.wikipedia.org/wiki/FTSE_MIB",

"cols": ["Ticker", "Symbol"],

"manual": [

"ISP.MI","UCG.MI","ENI.MI","ENEL.MI","G.MI","SRG.MI","PRY.MI","TIT.MI",

"RACE.MI","MONC.MI","LDO.MI","A2A.MI","AGL.MI","ATL.MI","AMP.MI",

"BGN.MI","BMED.MI","BPE.MI","BZU.MI","CPR.MI","CNH.MI","CNHI.MI",

"CRG.MI","CVLT.MI","DIG.MI","DNLM.MI","ERG.MI","EXO.MI","FBK.MI",

"FCA.MI","FCMA.MI","FNM.MI","GEO.MI","HER.MI","IREN.MI","INW.MI",

"IVG.MI","MB.MI","MDBI.MI","MESH.MI","MONC.MI","MPS.MI","NWL.MI",

"OVS.MI","PIRC.MI","PLT.MI","PST.MI","RINA.MI","REC.MI","SAVE.MI",

"SFT.MI","SGM.MI","SFER.MI","SIAS.MI","STS.MI","STM.MI","SUN.MI",

"TELO.MI","TEN.MI","TERNA.MI","TFI.MI","TOD.MI","TRN.MI","UBI.MI",

],

},

# ══════════════════════════════════════════════════════════════

# JAPAN — Nikkei 225 (complete list)

# ══════════════════════════════════════════════════════════════

{

"country": "Japan",

"country_code": "JP",

"index_name": "NIKKEI225",

"url": "https://en.wikipedia.org/wiki/Nikkei_225",

"cols": ["Ticker", "Code", "Symbol"],

"manual": [

# Technology & Electronics

"7203.T","6758.T","9984.T","8306.T","6861.T","4063.T","9432.T",

"8035.T","6902.T","7267.T","4661.T","6501.T","6702.T","6752.T",

"6753.T","6762.T","6857.T","6954.T","6971.T","6981.T","7733.T",

"7751.T","7974.T","8697.T","9613.T","9983.T","9987.T",

# Automotive

"7011.T","7012.T","7013.T","7201.T","7205.T","7211.T","7261.T",

"7269.T","7270.T","7272.T","5108.T","7282.T",

# Finance & Insurance

"8316.T","8411.T","8604.T","8725.T","8750.T","8766.T","8795.T",

"8801.T","8802.T","8830.T","8931.T","3382.T",

# Chemicals & Pharma

"4151.T","4183.T","4188.T","4502.T","4503.T","4506.T","4507.T",

"4523.T","4543.T","4568.T","4578.T","3407.T","4004.T","4005.T",

"4021.T","4042.T","4043.T","4061.T","4062.T",

# Construction & Real Estate

"1721.T","1801.T","1802.T","1803.T","1808.T","1812.T","1925.T",

"1928.T","5233.T","5332.T","5401.T","5411.T","5541.T",

# Retail & Consumer

"2502.T","2503.T","2801.T","2802.T","2871.T","2914.T","3086.T",

"3099.T","7832.T","7911.T","9831.T","2768.T","8267.T",

# Transport & Utilities

"9001.T","9005.T","9007.T","9008.T","9020.T","9022.T",

"9062.T","9064.T","9101.T","9104.T","9107.T","9202.T",

"9501.T","9503.T","9531.T","9532.T",

# Mining, Steel & Materials

"5711.T","5713.T","5714.T","5802.T","5803.T","5901.T",

],

},

# ══════════════════════════════════════════════════════════════

# AUSTRALIA — ASX 200

# ══════════════════════════════════════════════════════════════

{

"country": "Australia",

"country_code": "AU",

"index_name": "ASX200",

"url": "https://en.wikipedia.org/wiki/S%26P/ASX_200",

"cols": ["Ticker", "Code", "Symbol"],

"manual": [

"BHP.AX","CBA.AX","CSL.AX","NAB.AX","WBC.AX","ANZ.AX","MQG.AX",

"WES.AX","RIO.AX","TLS.AX","FMG.AX","WOW.AX","GMG.AX","MFG.AX",

"ALL.AX","APA.AX","AGL.AX","AMC.AX","ANN.AX","APT.AX","ARB.AX",

"ASX.AX","BEN.AX","BLD.AX","BOQ.AX","BXB.AX","CAR.AX","CCP.AX",

"CGF.AX","CHC.AX","COL.AX","CPU.AX","CWN.AX","DXS.AX","EBO.AX",

"ELD.AX","EVN.AX","FLT.AX","GNC.AX","GPT.AX","HVN.AX","IAG.AX",

"IEL.AX","IFL.AX","IGO.AX","ILU.AX","JBH.AX","LLC.AX","LYC.AX",

"MGR.AX","MIN.AX","MPL.AX","MTS.AX","NEC.AX","NHF.AX","NIC.AX",

"NWS.AX","NXT.AX","ORA.AX","ORG.AX","ORI.AX","OZL.AX","PLS.AX",

"PMV.AX","PPT.AX","PRN.AX","QAN.AX","QBE.AX","REA.AX","REH.AX",

"RHC.AX","RMD.AX","RRL.AX","S32.AX","SCG.AX","SDF.AX","SEK.AX",

"SFR.AX","SGM.AX","SGP.AX","SHL.AX","SKC.AX","SLX.AX","SOL.AX",

"SPK.AX","STO.AX","SUN.AX","SVW.AX","TAH.AX","TCL.AX","TWE.AX",

"UNI.AX","VCX.AX","VEA.AX","VNT.AX","WAF.AX","WDS.AX","WHC.AX",

"WOR.AX","WTC.AX","XRO.AX","Z1P.AX","29M.AX","360.AX","3PL.AX",

"A2M.AX","ABC.AX","ABP.AX","AD8.AX","ALD.AX","ALQ.AX","ALU.AX",

"AMP.AX","APE.AX","APX.AX","ARF.AX","ATM.AX","AUB.AX","AWC.AX",

"AX1.AX","BAP.AX","BBN.AX","BGA.AX","BKW.AX","BPT.AX","BSL.AX",

"BWP.AX","CAT.AX","CIA.AX","CMW.AX","CNU.AX","CQR.AX","CSR.AX",

"CTD.AX","CWP.AX","DEG.AX","DHG.AX","DMP.AX","DNS.AX","DOW.AX",

"DRR.AX","DSH.AX","DTL.AX","ELO.AX","EMR.AX","FCL.AX","FFI.AX",

"FPH.AX","GOR.AX","GUD.AX","GWA.AX","HDN.AX","HLS.AX","HMC.AX",

"HUB.AX","IPH.AX","IPL.AX","IVC.AX","JHG.AX","JHX.AX","KAR.AX",

"KGN.AX","LFS.AX","LKE.AX","LNK.AX","LOV.AX","LTP.AX","LYL.AX",

"MAH.AX","MAQ.AX","MCR.AX","MEZ.AX","MHJ.AX","MVF.AX","MYX.AX",

"NCM.AX","NWL.AX","OFX.AX","OML.AX","PDL.AX","PEB.AX","PFP.AX",

"PGH.AX","PLY.AX","PME.AX","PNI.AX","PSI.AX","PTM.AX","QMS.AX",

"RAP.AX","RBL.AX","RCE.AX","RFF.AX","RFG.AX","RMC.AX","RWC.AX",

"SIL.AX","SLR.AX","SMR.AX","SOM.AX","SPL.AX","SQ2.AX","SSM.AX",

"SXL.AX","TGR.AX","THL.AX","TLC.AX","TNE.AX","TOP.AX","TUA.AX",

"UMG.AX","UWL.AX","VUK.AX","WGX.AX","WNR.AX","WSA.AX","WSP.AX",

],

},

# ══════════════════════════════════════════════════════════════

# CANADA — TSX 60 + large caps

# ══════════════════════════════════════════════════════════════

{

"country": "Canada",

"country_code": "CA",

"index_name": "TSX60",

"url": "https://en.wikipedia.org/wiki/S%26P/TSX_60",

"cols": ["Ticker", "Symbol"],

"manual": [

"RY.TO","TD.TO","ENB.TO","CNR.TO","CP.TO","BNS.TO","BMO.TO","CM.TO",

"SU.TO","MFC.TO","TRI.TO","ABX.TO","BCE.TO","CNQ.TO","DOL.TO","FNV.TO",

"GIB-A.TO","GWO.TO","IMO.TO","IFC.TO","L.TO","MRU.TO","NA.TO","NTR.TO",

"OVV.TO","POW.TO","PPL.TO","QSR.TO","RCI-B.TO","SAP.TO","SLF.TO",

"SHOP.TO","SNC.TO","SPB.TO","SRU-UN.TO","T.TO","TRP.TO","WCN.TO",

"WFG.TO","WPM.TO","WSP.TO","X.TO","CCL-B.TO","CTC-A.TO","EMP-A.TO",

"ERF.TO","FR.TO","H.TO","HBM.TO","KEY.TO","KL.TO","LUN.TO","MG.TO",

"NGT.TO","NPI.TO","OGC.TO","PBA.TO","PD.TO","PKI.TO","REI-UN.TO",

"RUS.TO","SJ.TO","STN.TO","TECK-B.TO","TOU.TO","TVA-B.TO","WJA.TO",

"AEM.TO","AGI.TO","ALA.TO","ARX.TO","ATA.TO","ATD.TO","BB.TO",

"BBD-B.TO","BEI-UN.TO","BHC.TO","BIP-UN.TO","BPY-UN.TO","BYD-UN.TO",

"CAE.TO","CJR-B.TO","CLS.TO","CWB.TO","DII-B.TO","DRG-UN.TO",

"EFN.TO","EIF.TO","EMP-B.TO","ERO.TO","ESI.TO","FCR-UN.TO",

],

},

# ══════════════════════════════════════════════════════════════

# BRAZIL — Ibovespa (71 constituents — full list)

# ══════════════════════════════════════════════════════════════

{

"country": "Brazil",

"country_code": "BR",

"index_name": "IBOVESPA",

"url": "https://en.wikipedia.org/wiki/Ibovespa",

"cols": ["Ticker", "Symbol"],

"manual": [

"VALE3.SA","PETR4.SA","ITUB4.SA","PETR3.SA","BBDC4.SA","ABEV3.SA",

"WEGE3.SA","BBAS3.SA","ITSA4.SA","B3SA3.SA","EQTL3.SA","RENT3.SA",

"PRIO3.SA","RDOR3.SA","SUZB3.SA","VIVT3.SA","SBSP3.SA","LREN3.SA",

"GGBR4.SA","TIMS3.SA","RADL3.SA","VBBR3.SA","UGPA3.SA","CMIG4.SA",

"RAIL3.SA","CPLE6.SA","CSAN3.SA","HAPV3.SA","ELET3.SA","ELET6.SA",

"CCRO3.SA","CPFE3.SA","CSNA3.SA","EMBR3.SA","KLBN11.SA","ENGI11.SA",

"EGIE3.SA","ASAI3.SA","TOTS3.SA","ALOS3.SA","CYRE3.SA","MULT3.SA",

"SOMA3.SA","CRFB3.SA","MRFG3.SA","BRFS3.SA","GOAU4.SA","COGN3.SA",

"AZUL4.SA","CVCB3.SA","EZTC3.SA","MRVE3.SA","BEEF3.SA","SMTO3.SA",

"YDUQ3.SA","PETZ3.SA","BHIA3.SA","DXCO3.SA","MGLU3.SA","FLRY3.SA",

"ALPA4.SA","ARZZ3.SA","RAIZ4.SA","RECV3.SA","SLCE3.SA","VIVA3.SA",

"TRPL4.SA","POMO4.SA","BPAC11.SA","STBP3.SA","BRAP4.SA","SMLS3.SA",

# Additional B3 large caps

"ALUP11.SA","AURE3.SA","AZEV3.SA","BRML3.SA","BRPR3.SA","CARD3.SA",

"CMIN3.SA","CNTB3.SA","CURY3.SA","DIRR3.SA","ECOR3.SA","ENEV3.SA",

"ESPA3.SA","EVEN3.SA","FESA4.SA","GGPS3.SA","GMAT3.SA","GRND3.SA",

"HBSA3.SA","HYPE3.SA","IFCM3.SA","IGTI11.SA","IRBR3.SA","ITUB3.SA",

"JHSF3.SA","LJQQ3.SA","LOGG3.SA","LWSA3.SA","MDIA3.SA","MILS3.SA",

"MOVI3.SA","MYPK3.SA","NEOE3.SA","ODPV3.SA","OIBR3.SA","ONCO3.SA",

"ORVR3.SA","PCAR3.SA","PDGR3.SA","PORT3.SA","PTBL3.SA","QUAL3.SA",

"RAPT4.SA","RDNI3.SA","REDE3.SA","ROMI3.SA","RRRP3.SA","SBFG3.SA",

"SMFT3.SA","TAEE11.SA","TGMA3.SA","TPVB3.SA","TRIS3.SA","TTEN3.SA",

"TUPY3.SA","UNIP6.SA","USIM5.SA","VALE3.SA","VAMO3.SA","VIVA3.SA",

],

},

# ══════════════════════════════════════════════════════════════

# INDIA — Nifty 50 + Nifty Next 50

# ══════════════════════════════════════════════════════════════

{

"country": "India",

"country_code": "IN",

"index_name": "NIFTY50",

"url": "https://en.wikipedia.org/wiki/NIFTY_50",

"cols": ["Ticker", "Symbol"],

"manual": [

# Nifty 50

"RELIANCE.NS","TCS.NS","HDFCBANK.NS","INFY.NS","ICICIBANK.NS",

"HINDUNILVR.NS","SBIN.NS","BHARTIARTL.NS","ITC.NS","LT.NS",

"KOTAKBANK.NS","AXISBANK.NS","BAJFINANCE.NS","MARUTI.NS","TITAN.NS",

"SUNPHARMA.NS","NESTLEIND.NS","HCLTECH.NS","ULTRACEMCO.NS","POWERGRID.NS",

"NTPC.NS","WIPRO.NS","ONGC.NS","ASIANPAINT.NS","TECHM.NS","ADANIENT.NS",

"ADANIPORTS.NS","BAJAJFINSV.NS","BPCL.NS","BRITANNIA.NS","CIPLA.NS",

"COALINDIA.NS","DIVISLAB.NS","DRREDDY.NS","EICHERMOT.NS","GRASIM.NS",

"HDFCLIFE.NS","HEROMOTOCO.NS","HINDALCO.NS","INDUSINDBK.NS","JSWSTEEL.NS",

"M&M.NS","ONGC.NS","SBILIFE.NS","SHRIRAMFIN.NS","TATACONSUM.NS",

"TATAMOTORS.NS","TATASTEEL.NS","TRENT.NS","UPL.NS",

# Nifty Next 50

"ABB.NS","ACC.NS","ADANIGREEN.NS","ADANITRANS.NS","AMBUJACEM.NS",

"APOLLOHOSP.NS","AUROPHARMA.NS","BAJAJ-AUTO.NS","BANKBARODA.NS",

"BERGEPAINT.NS","BOSCHLTD.NS","CANFINHOME.NS","CANBK.NS","CHOLAFIN.NS",

"COLPAL.NS","DABUR.NS","DLF.NS","GAIL.NS","GODREJCP.NS","HAVELLS.NS",

"ICICIPRULI.NS","IDFCFIRSTB.NS","IGL.NS","INDUSTOWER.NS","IOC.NS",

"IRCTC.NS","JINDALSTEL.NS","JUBLFOOD.NS","LICHSGFIN.NS","LUPIN.NS",

"MARICO.NS","MCDOWELL-N.NS","MOTHERSON.NS","MPHASIS.NS","MRF.NS",

"NAUKRI.NS","NMDC.NS","OFSS.NS","PAGEIND.NS","PIIND.NS","PIDILITIND.NS",

"PNBHOUSING.NS","POONAWALLA.NS","RECLTD.NS","SAIL.NS","SIEMENS.NS",

"SRF.NS","TORNTPHARM.NS","TVSMOTOR.NS","VBL.NS","VEDL.NS","VOLTAS.NS",

"ZYDUSLIFE.NS",

],

},

# ══════════════════════════════════════════════════════════════

# SOUTH KOREA — KOSPI 200 large caps

# ══════════════════════════════════════════════════════════════

{

"country": "South Korea",

"country_code": "KR",

"index_name": "KOSPI",

"url": "https://en.wikipedia.org/wiki/KOSPI",

"cols": ["Ticker", "Symbol", "Code"],

"manual": [

"005930.KS","000660.KS","035420.KS","051910.KS","006400.KS",

"207940.KS","035720.KS","000270.KS","068270.KS","105560.KS",

"055550.KS","028260.KS","012330.KS","066570.KS","003550.KS",

"010130.KS","096770.KS","017670.KS","034730.KS","003490.KS",

"000810.KS","011200.KS","015760.KS","032640.KS","034020.KS",

"036570.KS","047050.KS","086790.KS","138040.KS","139480.KS",

"161390.KS","180640.KS","192820.KS","214420.KS","247540.KS",

"251270.KS","267250.KS","271560.KS","282330.KS","316140.KS",

"326030.KS","329180.KS","336370.KS","352820.KS","361610.KS",

"373220.KS","402340.KS","003410.KS","004020.KS","005380.KS",

"005490.KS","006360.KS","007070.KS","009150.KS","009830.KS",

"010120.KS","010950.KS","011070.KS","011170.KS","011790.KS",

"012450.KS","014820.KS","018260.KS","018880.KS","023530.KS",

"024110.KS","028050.KS","029780.KS","030200.KS","033780.KS",

],

},

# ══════════════════════════════════════════════════════════════

# HONG KONG — Hang Seng Index (correct yfinance format: 4-digit.HK)

# ══════════════════════════════════════════════════════════════

{

"country": "Hong Kong",

"country_code": "HK",

"index_name": "HSI",

"url": "https://en.wikipedia.org/wiki/Hang_Seng_Index",

"cols": ["Ticker", "Code", "Symbol"],

"manual": [

# Must use zero-padded format for yfinance

"0700.HK","0005.HK","0941.HK","1299.HK","0388.HK","2318.HK",

"0016.HK","1093.HK","0883.HK","2628.HK","0003.HK","0006.HK",

"0011.HK","0012.HK","0027.HK","0066.HK","0101.HK","0175.HK",

"0241.HK","0267.HK","0285.HK","0288.HK","0291.HK","0300.HK",

"0316.HK","0322.HK","0386.HK","0669.HK","0688.HK","0762.HK",

"0823.HK","0836.HK","0857.HK","0868.HK","0881.HK","0939.HK",

"0960.HK","0968.HK","0981.HK","0992.HK","1024.HK","1038.HK",

"1044.HK","1088.HK","1099.HK","1109.HK","1113.HK","1177.HK",

"1209.HK","1211.HK","1299.HK","1378.HK","1398.HK","1810.HK",

"1876.HK","1928.HK","1929.HK","1997.HK","2015.HK","2018.HK",

"2020.HK","2057.HK","2269.HK","2313.HK","2319.HK","2331.HK",

"2359.HK","2382.HK","2388.HK","2618.HK","2628.HK","2688.HK",

"2899.HK","3690.HK","3692.HK","3968.HK","3988.HK","6618.HK",

"6690.HK","6862.HK","9618.HK","9633.HK","9888.HK","9961.HK",

"9988.HK","9992.HK","9999.HK",

],

},

# ══════════════════════════════════════════════════════════════

# SINGAPORE — Straits Times Index + SGX large caps

# ══════════════════════════════════════════════════════════════

{

"country": "Singapore",

"country_code": "SG",

"index_name": "STI30",

"url": "https://en.wikipedia.org/wiki/Straits_Times_Index",

"cols": ["Ticker", "Symbol"],

"manual": [

"D05.SI","O39.SI","U11.SI","Z74.SI","C52.SI","G13.SI","BN4.SI",

"C6L.SI","Y92.SI","V03.SI","A17U.SI","BS6.SI","C07.SI","C09.SI",

"C38U.SI","D01.SI","F34.SI","H78.SI","J36.SI","J69U.SI","K71U.SI",

"M44U.SI","ME8U.SI","N2IU.SI","N4E.SI","NS8U.SI","P15.SI","RE4.SI",

"S51.SI","S58.SI","S68.SI","T82U.SI","U09.SI","U96.SI","UD2.SI",

],

},

# ══════════════════════════════════════════════════════════════

# DENMARK — OMX Copenhagen 25

# ══════════════════════════════════════════════════════════════

{

"country": "Denmark",

"country_code": "DK",

"index_name": "OMXC25",

"url": "https://en.wikipedia.org/wiki/OMX_Copenhagen_25",

"cols": ["Ticker", "Symbol"],

"manual": [

"NOVO-B.CO","MAERSK-B.CO","DSV.CO","ORSTED.CO","CARL-B.CO",

"COLO-B.CO","GN.CO","TRYG.CO","PNDORA.CO","RBREW.CO",

"AMBU-B.CO","CHR.CO","DEMANT.CO","FLS.CO","GMAB.CO",

"ISS.CO","JYSK.CO","NNIT.CO","NTG.CO","NZYM-B.CO",

"ROCK-B.CO","SIM.CO","SOLAR-B.CO","SPLY.CO","VWS.CO",

],

},

# ══════════════════════════════════════════════════════════════

# NORWAY — OBX 25 + large caps

# ══════════════════════════════════════════════════════════════

{

"country": "Norway",

"country_code": "NO",

"index_name": "OBX25",

"url": "https://en.wikipedia.org/wiki/OBX_Stock_Index",

"cols": ["Ticker", "Symbol"],

"manual": [

"EQNR.OL","DNB.OL","MOWI.OL","YAR.OL","TEL.OL","ORK.OL",

"NHY.OL","AKRBP.OL","BAKKA.OL","SUBC.OL","SCHA.OL",

"AKER.OL","AKSO.OL","BWLPG.OL","FRO.OL","GOGL.OL",

"HAFNIA.OL","NSKOG.OL","ODF.OL","PGS.OL","REC.OL",

"SALM.OL","SCHB.OL","STB.OL","TGS.OL","WAWI.OL",

"AFG.OL","AGAS.OL","ARCH.OL","BORR.OL","COOL.OL",

"FLNG.OL","HECO.OL","HUNT.OL","JINHUI.OL","MAG.OL",

"MPCC.OL","NAVA.OL","NEXT.OL","OKEA.OL","OSE.OL",

],

},

# ══════════════════════════════════════════════════════════════

# FINLAND — OMX Helsinki 25

# ══════════════════════════════════════════════════════════════

{

"country": "Finland",

"country_code": "FI",

"index_name": "OMX_Helsinki",

"url": "https://en.wikipedia.org/wiki/OMX_Helsinki_25",

"cols": ["Ticker", "Symbol"],

"manual": [

"NOKIA.HE","KNEBV.HE","NESTE.HE","SAMPO.HE","OUT1V.HE","FORTUM.HE",

"WRT1V.HE","STERV.HE","KEMIRA.HE","TIETO.HE","CGCBV.HE","ELISA.HE",

"FSKRS.HE","HUH1V.HE","ICP1V.HE","KEMIRA.HE","KESKOB.HE","KONE.HE",

"METSO.HE","METSB.HE","NDA-FI.HE","ORNBV.HE","PIHLIS.HE","QTCOM.HE",

"RAIVV.HE","RTRKS.HE","SAMAS.HE","SRV1V.HE","SSABAH.HE","TEM1V.HE",

"TIE1V.HE","TNOM.HE","UPM.HE","VALMT.HE","YIT1V.HE",

],

},

# ══════════════════════════════════════════════════════════════

# POLAND — WIG 20 + mWIG 40 extras

# ══════════════════════════════════════════════════════════════

{

"country": "Poland",

"country_code": "PL",

"index_name": "WIG20",

"url": "https://en.wikipedia.org/wiki/WIG20",

"cols": ["Ticker", "Symbol"],

"manual": [

"PKN.WA","PKO.WA","PZU.WA","DNP.WA","JSW.WA","LPP.WA","OPL.WA",

"CDR.WA","ALE.WA","CCC.WA","DIINO.WA","EUR.WA","HRS.WA","ING.WA",

"KGH.WA","MBK.WA","MRC.WA","PCO.WA","PEPCO.WA","PEO.WA",

"PKP.WA","PLW.WA","PZU.WA","SPH.WA","TEN.WA",

],

},

# ══════════════════════════════════════════════════════════════

# SOUTH AFRICA — JSE Top 40

# ══════════════════════════════════════════════════════════════

{

"country": "South Africa",

"country_code": "ZA",

"index_name": "JSE_TOP40",

"url": "https://en.wikipedia.org/wiki/JSE_Securities_Exchange",

"cols": ["Ticker", "Symbol"],

"manual": [

"NPN.JO","PRX.JO","BTI.JO","AGL.JO","SOL.JO","SBK.JO","NED.JO",

"FSR.JO","ABG.JO","CFR.JO","BVT.JO","DSY.JO","GRT.JO","HAR.JO",

"IMP.JO","INL.JO","INP.JO","IPL.JO","LHC.JO","MCG.JO","MNP.JO",

"MRP.JO","MTN.JO","MUR.JO","NHM.JO","NRP.JO","OMU.JO","PPH.JO",

"RBP.JO","RDF.JO","REM.JO","RNI.JO","SHP.JO","SPP.JO","TFG.JO",

"TGA.JO","TRU.JO","VOD.JO","WHL.JO","ANG.JO","EXX.JO","GFI.JO",

],

},

# ══════════════════════════════════════════════════════════════

# BELGIUM — BEL 20

# ══════════════════════════════════════════════════════════════

{

"country": "Belgium",

"country_code": "BE",

"index_name": "BEL20",

"url": "https://en.wikipedia.org/wiki/BEL20",

"cols": ["Ticker", "Symbol"],

"manual": [

"UCB.BR","KBC.BR","ACKB.BR","ABI.BR","SOLB.BR","COFB.BR","COLR.BR",

"ARGX.BR","WDP.BR","BPOST.BR","ELIA.BR","GBLB.BR","ING.BR","LOTB.BR",

"MELX.BR","ONTEX.BR","UCB.BR","UMI.BR","XIOR.BR",

],

},

# ══════════════════════════════════════════════════════════════

# PORTUGAL — PSI 20

# ══════════════════════════════════════════════════════════════

{

"country": "Portugal",

"country_code": "PT",

"index_name": "PSI20",

"url": "https://en.wikipedia.org/wiki/PSI-20",

"cols": ["Ticker", "Symbol"],

"manual": [

"EDP.LS","GALP.LS","BCP.LS","NOS.LS","JMT.LS","SON.LS","EGL.LS",

"EDPR.LS","CTT.LS","NVG.LS","ALTR.LS","COR.LS","ELEC.LS","ENGI.LS",

"IPMA.LS","MOTA.LS","PHR.LS","RAMB.LS","RENE.LS","TDSA.LS",

],

},

# ══════════════════════════════════════════════════════════════

# AUSTRIA — ATX 20

# ══════════════════════════════════════════════════════════════

{

"country": "Austria",

"country_code": "AT",

"index_name": "ATX20",

"url": "https://en.wikipedia.org/wiki/Austrian_Traded_Index",

"cols": ["Ticker", "Symbol"],

"manual": [

"EBS.VI","OMV.VI","VIG.VI","RBI.VI","POST.VI","TKA.VI","EVN.VI",

"SBO.VI","AT1.VI","ATS.VI","BG.VI","CAI.VI","DO.VI","EAG.VI",

"FMT.VI","GRB.VI","IIA.VI","KAP.VI","LNZ.VI","MIBA.VI","MOS.VI",

"NWT.VI","OMV.VI","PAL.VI","PYT.VI","QPS.VI","S.VI","SPI.VI",

"TKH.VI","TQQ.VI","UNI.VI","VAS.VI","VER.VI","WIE.VI","ZAG.VI",

],

},

# ══════════════════════════════════════════════════════════════

# IRELAND — ISEQ 20

# ══════════════════════════════════════════════════════════════

{

"country": "Ireland",

"country_code": "IE",

"index_name": "ISEQ20",

"url": "https://en.wikipedia.org/wiki/ISEQ_20",

"cols": ["Ticker", "Symbol"],

"manual": [

# Irish stocks primarily trade in Dublin (.IR) or London (.L)

"CRH.L","FLTR.L","ICG.L","BIRG.L","AIB.L","PTSB.L","TDOC.L",

"CRH.IR","FLTR.IR","ICG.IR","BIRG.IR","AIB.IR","PTSB.IR",

"KORE.IR","ORLA.IR","CPL.IR","DHG.IR","DRV.IR","GLB.IR",

"GLV.IR","GOI.IR","IFG.IR","INA.IR","IRM.IR","ISF.IR",

"MALIN.IR","MAN.IR","NWL.IR","OGN.IR","SMURFIT.L","TPVG.IR",

"AMRG.L","AERCAP.L","DPLM.L","G4M.L","GYM.L","KNDL.L",

],

},

# ══════════════════════════════════════════════════════════════

# MEXICO — IPC / BMV (correct suffixes — use MX not .MX for BMV)

# ══════════════════════════════════════════════════════════════

{

"country": "Mexico",

"country_code": "MX",

"index_name": "IPC35",

"url": "https://en.wikipedia.org/wiki/Indice_de_Precios_y_Cotizaciones",

"cols": ["Ticker", "Symbol"],

"manual": [

# yfinance: Mexican stocks use ticker.MX format

"AMXL.MX","FEMSAUBD.MX","WALMEX.MX","GMEXICOB.MX","KOFUBL.MX",

"GFNORTEO.MX","GFBANORTEO.MX","BOLSAA.MX","CEMEXCPO.MX","BIMBOA.MX",

"GCARSOA1.MX","TLEVICPO.MX","MEGACPO.MX","ALFAA.MX","ASURB.MX",

"GAPB.MX","OMAB.MX","GENTERA.MX","RA.MX","PINFRA.MX","ORBIA.MX",

"GRUMAB.MX","KIMBER.MX","LIVEPOLC-1.MX","LAB.MX","LABB.MX",

"VOLAR.MX","AC.MX","AGUA.MX","ALSEA.MX","AMX.MX","BACHOCOB.MX",

"CUERVO.MX","FINN13.MX","GICSAB.MX","GPROFUT.MX","GCC.MX",

"ICHB.MX","LABB.MX","LIVEPOLC1.MX","MFRISCOA-1.MX","PASA.MX",

],

},

# ══════════════════════════════════════════════════════════════

# NEW ZEALAND — NZX 50

# ══════════════════════════════════════════════════════════════

{

"country": "New Zealand",

"country_code": "NZ",

"index_name": "NZX50",

"url": "https://en.wikipedia.org/wiki/S%26P/NZX_50_Index",

"cols": ["Ticker", "Symbol"],

"manual": [

"FPH.NZ","MEL.NZ","CEN.NZ","ATM.NZ","EBO.NZ","MCY.NZ","PCT.NZ",

"SUM.NZ","AIA.NZ","HGH.NZ","AIR.NZ","ANZ.NZ","ARG.NZ","CAV.NZ",

"CDI.NZ","CMO.NZ","CNU.NZ","CVT.NZ","DGL.NZ","DIL.NZ","EBO.NZ",

"EMF.NZ","EVO.NZ","FCG.NZ","FRE.NZ","FSF.NZ","GNE.NZ","GTK.NZ",

"HLG.NZ","IFT.NZ","KMD.NZ","MFT.NZ","MHJ.NZ","MNW.NZ","MYR.NZ",

"NPX.NZ","NZR.NZ","OCA.NZ","PFI.NZ","PGW.NZ","POT.NZ","PPH.NZ",

"RBD.NZ","RYM.NZ","SCL.NZ","SKC.NZ","SKT.NZ","SML.NZ","SPK.NZ",

"STU.NZ","THL.NZ","THL.NZ","TPW.NZ","TRA.NZ","TWR.NZ","VCT.NZ",

"VGL.NZ","VHP.NZ","WBC.NZ","WHS.NZ",

],

},

]

# ═══════════════════════════════════════════════════════════════════════════════

# RUN

# ═══════════════════════════════════════════════════════════════════════════════

def run_all(jobs: list, parallel: bool = True):

if parallel:

with ThreadPoolExecutor(max_workers=MAX_WORKERS) as executor:

futures = {executor.submit(extract_country_data, job): job["country"] for job in jobs}

for future in as_completed(futures):

country = futures[future]

try:

future.result()

except Exception as e:

log.error(f"FAILED: {country} — {e}")

else:

for job in jobs:

extract_country_data(job)

def run_single(country_name: str):

matches = [j for j in COUNTRY_JOBS if j["country"].lower() == country_name.lower()]

if not matches:

log.error(f"Country '{country_name}' not found.")

log.info(f"Available: {[j['country'] for j in COUNTRY_JOBS]}")

return

extract_country_data(matches[0])

if __name__ == "__main__":

import argparse

parser = argparse.ArgumentParser(description="Global Stock Data Extractor v2")

parser.add_argument("--country", type=str, default=None,

help="Run for a single country (e.g. --country Brazil)")

parser.add_argument("--sequential", action="store_true",

help="Disable parallel processing")

args = parser.parse_args()

if args.country:

run_single(args.country)

else:

run_all(COUNTRY_JOBS, parallel=not args.sequential)

China Export 400 Stocks

import pandas as pd

import yfinance as yf

import ssl

import io

import urllib.request

# --- BYPASS SSL CERTIFICATE ISSUES ---

ssl._create_default_https_context = ssl._create_unverified_context

def get_china_mchi_tickers():

"""

Fetches the detailed holdings CSV directly from iShares MCHI page.

Maps tickers to their Yahoo Finance equivalents (.HK, .SS, .SZ, or US).

"""

# The direct CSV download link for MCHI holdings

csv_url = "https://www.ishares.com/us/products/239619/ishares-msci-china-etf/1467271812596.ajax?fileType=csv&fileName=MCHI_holdings&dataType=fund"

headers = {'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/537.36'}

req = urllib.request.Request(csv_url, headers=headers)

ticker_list = []

try:

with urllib.request.urlopen(req) as response:

content = response.read().decode('utf-8')

# iShares CSVs often have metadata in the first 9 rows

df = pd.read_csv(io.StringIO(content), skiprows=9)

if 'Ticker' in df.columns and 'Exchange' in df.columns:

for index, row in df.iterrows():

ticker = str(row['Ticker']).strip()

exchange = str(row['Exchange']).strip()

# Mapping logic for Yahoo Finance

if exchange == "Hong Kong Stock Exchange":

# Ensure 4-digit numeric for HK (e.g., 700 -> 0700.HK)

clean_t = ticker.zfill(4) + ".HK"

elif exchange == "Shanghai Stock Exchange":

clean_t = ticker + ".SS"

elif exchange == "Shenzhen Stock Exchange":

clean_t = ticker + ".SZ"

elif exchange in ["NASDAQ", "New York Stock Exchange Inc."]:

clean_t = ticker # US ADRs have no suffix

else:

continue

ticker_list.append(clean_t)

except Exception as e:

print(f"Automated fetch failed: {e}. Falling back to manual heavyweights...")

# Manual fallback for the top 15 most important names

ticker_list = [

"0700.HK", "BABA", "0939.HK", "1810.HK", "PDD", "1398.HK",

"2318.HK", "3690.HK", "1211.HK", "3988.HK", "NTES", "BIDU",

"2628.HK", "JD", "600519.SS"

]

return list(set(ticker_list))

# --- PHASE 1: GET TICKERS & VALIDATE ---

tickers = get_china_mchi_tickers()

print(f"Phase 1: Validating {len(tickers)} China Tickers...")

cap_list = []

for t in tickers:

try:

# Note: China A-Shares (SS/SZ) can be slow to respond to bulk info requests

stock = yf.Ticker(t)

info = stock.info

m_cap = info.get('marketCap', 0)

currency = info.get('currency', 'HKD') # Default to HKD/USD/CNY

if m_cap > 0:

cap_list.append({'Ticker': t, 'MarketCap': m_cap, 'Currency': currency})

print(f"Success: {t} | Cap: {m_cap:,} {currency}")

except Exception:

pass # Skip failed fetches quietly to keep console clean

# Sort by Market Cap

sorted_df = pd.DataFrame(cap_list)

if not sorted_df.empty:

sorted_df = sorted_df.sort_values(by='MarketCap', ascending=False)

ordered_tickers = sorted_df['Ticker'].tolist()

else:

print("No valid data found.")

exit()

# --- PHASE 2: DOWNLOAD HISTORICAL DATA ---

# China data availability on Yahoo varies: HK is good back to the 90s, A-Shares vary.

print(f"\nPhase 2: Downloading Daily Data for {len(ordered_tickers)} stocks...")

start = "1976-01-01"

end = "2026-03-21"

data = yf.download(ordered_tickers, start=start, end=end, auto_adjust=True)

if isinstance(data.columns, pd.MultiIndex):

close_data = data['Close']

else:

close_data = data

# --- PHASE 3: EXPORT ---

df_wide = close_data.transpose()

df_wide.columns = pd.to_datetime(df_wide.columns).strftime('%Y-%m-%d')

file_name = f"China_MCHI_Sorted_{len(ordered_tickers)}.csv"

df_wide.to_csv(file_name)

print("-" * 30)

print(f"Done! Exported {len(ordered_tickers)} stocks to {file_name}")

South Korea 80

import pandas as pd

import yfinance as yf

import ssl

import urllib.request

# --- BYPASS SSL CERTIFICATE ISSUES ---

ssl._create_default_https_context = ssl._create_unverified_context

def get_south_korea_tickers():

"""

Manual list of the MSCI South Korea Index constituents (~87 stocks).

Using .KS suffix for KOSPI (Main Board).

"""

# This list covers the major heavyweights and mid-caps in the index

tickers_str = (

"005930.KS, 000660.KS, 373220.KS, 207940.KS, 005380.KS, 068270.KS, 005490.KS, 051910.KS, "

"105560.KS, 000270.KS, 035420.KS, 006400.KS, 035720.KS, 003550.KS, 012330.KS, 032830.KS, "

"055550.KS, 066570.KS, 096770.KS, 000810.KS, 033780.KS, 086790.KS, 009150.KS, 010140.KS, "

"017670.KS, 015760.KS, 003670.KS, 329180.KS, 018260.KS, 316140.KS, 011780.KS, 024110.KS, "

"034730.KS, 009540.KS, 010950.KS, 259960.KS, 086280.KS, 034220.KS, 011170.KS, 004020.KS, "

"005940.KS, 000100.KS, 028260.KS, 047050.KS, 001040.KS, 036570.KS, 009830.KS, 051900.KS, "

"023530.KS, 030200.KS, 011200.KS, 005830.KS, 161390.KS, 267260.KS, 000720.KS, 090430.KS, "

"006800.KS, 047810.KS, 010130.KS, 012450.KS, 302440.KS, 003490.KS, 138040.KS, 010120.KS, "

"028300.KS, 196170.KS, 323410.KS, 271560.KS, 064350.KS, 032640.KS, 402340.KS, 034020.KS, "

"003230.KS, 326030.KS, 180640.KS, 443060.KS, 005935.KS, 005385.KS, 0126Z0.KS, 008770.KS, "

"042660.KS, 000670.KS, 047040.KS, 000080.KS, 000150.KS, 001450.KS, 004370.KS"

)

return [t.strip() for t in tickers_str.split(",")]

# --- PHASE 1: GET TICKERS & VALIDATE MARKET CAPS ---

tickers = get_south_korea_tickers()

print(f"Phase 1: Validating {len(tickers)} South Korea Tickers and fetching Market Caps...")

cap_list = []

for t in tickers:

try:

stock = yf.Ticker(t)

# KRW is the currency for South Korean stocks

m_cap = stock.info.get('marketCap', 0)

currency = stock.info.get('currency', 'KRW')

if m_cap > 0:

cap_list.append({'Ticker': t, 'MarketCap': m_cap, 'Currency': currency})

print(f"Success: {t} | Cap: {m_cap:,} {currency}")

else:

print(f"Verified (No Cap): {t}")

except Exception:

print(f"FAILED fetch for: {t}")

# Sort by Market Cap

sorted_df = pd.DataFrame(cap_list)

if not sorted_df.empty:

sorted_df = sorted_df.sort_values(by='MarketCap', ascending=False)

ordered_tickers = sorted_df[sorted_df['MarketCap'] > 0]['Ticker'].tolist()

else:

print("No valid data found.")

exit()

# --- PHASE 2: DOWNLOAD HISTORICAL DATA ---

print(f"\nPhase 2: Downloading Daily Data for {len(ordered_tickers)} stocks...")

start = "1976-01-01"

end = "2026-03-21"

data = yf.download(ordered_tickers, start=start, end=end, auto_adjust=True)

# Format for export (identical to your Taiwan/Portugal logic)

if isinstance(data.columns, pd.MultiIndex):

close_data = data['Close']

else:

close_data = data

valid_tickers = [t for t in ordered_tickers if t in close_data.columns]

close_data = close_data[valid_tickers]

# --- PHASE 3: EXPORT ---

df_wide = close_data.transpose()

df_wide.columns = pd.to_datetime(df_wide.columns).strftime('%Y-%m-%d')

file_name = f"SouthKorea_MSCI_MarketCap_Sorted_{len(valid_tickers)}.csv"

df_wide.to_csv(file_name)

print("-" * 30)

print(f"Done! Exported {len(valid_tickers)} stocks to {file_name}")

Japan 180

import pandas as pd

import yfinance as yf

import ssl

import numpy as np

# --- BYPASS SSL CERTIFICATE ISSUES ---

ssl._create_default_https_context = ssl._create_unverified_context

def get_japan_tickers_full():

"""

Manual list of the MSCI Japan constituents (181 stocks).

Using .T suffix for Tokyo Stock Exchange.

"""

tickers_str = (

"7203.T, 8306.T, 6501.T, 6758.T, 8316.T, 6857.T, 8035.T, 8411.T, 8058.T, 7011.T, "

"6861.T, 9984.T, 8031.T, 8001.T, 4063.T, 9983.T, 8766.T, 4502.T, 7974.T, 6098.T, "

"6902.T, 4503.T, 6702.T, 6301.T, 7267.T, 6503.T, 8053.T, 4519.T, 6981.T, 6367.T, "

"9432.T, 9433.T, 2914.T, 6146.T, 6273.T, 5108.T, 8801.T, 8802.T, 6723.T, 7741.T, "

"4901.T, 4661.T, 6954.T, 1925.T, 1928.T, 9101.T, 9104.T, 9107.T, 8002.T, 8015.T, "

"7733.T, 4568.T, 9020.T, 9021.T, 9022.T, 4689.T, 7261.T, 7201.T, 3407.T, 3402.T, "

"5401.T, 5411.T, 6504.T, 6506.T, 6762.T, 6869.T, 7751.T, 7752.T, 8037.T, 8267.T, "

"8308.T, 8309.T, 8601.T, 8604.T, 8630.T, 8725.T, 8750.T, 9201.T, 9202.T, 9501.T, "

"9502.T, 9503.T, 9613.T, 9735.T, 9843.T, 1605.T, 1801.T, 1802.T, 1803.T, 1812.T, "

"2267.T, 2502.T, 2503.T, 2801.T, 2802.T, 3088.T, 3092.T, 3289.T, 3382.T, 4021.T, "

"4183.T, 4188.T, 4324.T, 4452.T, 4507.T, 4523.T, 4543.T, 4578.T, 4612.T, 4704.T, "

"4732.T, 4768.T, 4911.T, 5020.T, 5201.T, 5332.T, 5713.T, 5802.T, 5901.T, 6113.T, "

"6326.T, 6471.T, 6479.T, 6586.T, 6645.T, 6701.T, 6752.T, 6920.T, 6971.T, 7012.T, "

"7013.T, 7269.T, 7270.T, 7272.T, 7309.T, 7532.T, 7832.T, 7911.T, 7912.T, 8113.T, "

"8227.T, 8233.T, 8252.T, 8331.T, 8354.T, 8355.T, 8410.T, 8473.T, 8591.T, 8593.T, "

"8830.T, 9001.T, 9005.T, 9007.T, 9008.T, 9009.T, 9041.T, 9042.T, 9064.T, 9301.T, "

"9508.T, 9531.T, 9532.T, 9602.T, 9684.T, 9697.T, 9766.T, 9989.T, 2269.T, 2413.T, "

"3436.T, 3659.T, 4151.T, 4528.T, 4921.T, 6724.T, 6976.T, 7182.T, 7186.T, 9434.T"

)

return [t.strip() for t in tickers_str.split(",")]

# --- PHASE 1: GET TICKERS & VALIDATE MARKET CAPS ---

print("Phase 1: Validating 181 Japan Tickers and fetching Market Caps...")

tickers = get_japan_tickers_full()

cap_list = []

# Note: This list is long, so we print progress

total = len(tickers)

for i, t in enumerate(tickers, 1):

try:

stock = yf.Ticker(t)

m_cap = stock.info.get('marketCap', 0)

currency = stock.info.get('currency', 'JPY')

cap_list.append({'Ticker': t, 'MarketCap': m_cap, 'Currency': currency})

if i % 20 == 0:

print(f"Progress: {i}/{total} verified...")

except Exception:

cap_list.append({'Ticker': t, 'MarketCap': 0, 'Currency': 'N/A'})

# Sort by Market Cap

sorted_df = pd.DataFrame(cap_list)

if not sorted_df.empty and 'MarketCap' in sorted_df.columns:

sorted_df = sorted_df.sort_values(by='MarketCap', ascending=False)

ordered_tickers = sorted_df[sorted_df['MarketCap'] > 0]['Ticker'].tolist()

else:

print("No valid MarketCap data found.")

exit()

# --- PHASE 2: DOWNLOAD HISTORICAL DATA ---

print(f"\nPhase 2: Downloading Daily Data for {len(ordered_tickers)} stocks...")

start = "1976-01-01"

end = "2026-03-21"

# Bulk download historical prices

data = yf.download(ordered_tickers, start=start, end=end, auto_adjust=True)

if isinstance(data.columns, pd.MultiIndex):

close_data = data['Close']

else:

close_data = data

# Filter only tickers that actually downloaded data and reorder by Market Cap

valid_tickers = [t for t in ordered_tickers if t in close_data.columns]

close_data = close_data[valid_tickers]

# --- PHASE 3: EXPORT ---

df_wide = close_data.transpose()

df_wide.columns = pd.to_datetime(df_wide.columns).strftime('%Y-%m-%d')

file_name = f"Japan_MSCI_MarketCap_Sorted_{len(valid_tickers)}.csv"

df_wide.to_csv(file_name)

print("-" * 30)

print(f"Done! Exported {len(valid_tickers)} stocks to {file_name}")

Daxx40 Germany

^GDAXI: DAX Performance Index

import pandas as pd

import yfinance as yf

import os

# 1. Added .DE to tickers to point to the German XETRA exchange

raw_tickers = ["SAP","SIE","ALV","DTE","ENR","RHM","MUV2","IFX","DBK","DB1","EOAN","DHL","BAS","MBG","BAYN","RWE","ADS","HEI","CBK","BMW","VNA","FRE","VOW3","DTG","MTX","HNR1","MRK","SHL","HEN3","SY1","G1A","FME","QIA","BEI","KBX","HEN","CON","TLX","HOT","SRT3","BNR","G24","PAH3","LEG","LHA","ZAL","HAG","BMW3","P911","EVD","NEM","EVK","RAA","DHER"]

tickers = [t + ".DE" for t in raw_tickers]

print("Phase 1: Ranking Tickers by Market Cap Weight...")

cap_list = []

# Fetching info for German tickers

for t in tickers:

try:

ticker_obj = yf.Ticker(t)

# Some German stocks report marketCap in EUR; yfinance handles conversion generally

m_cap = ticker_obj.info.get('marketCap', 0)

cap_list.append({'Ticker': t, 'MarketCap': m_cap})

print(f"Fetched: {t}")

except Exception as e:

print(f"Could not fetch {t}: {e}")

cap_list.append({'Ticker': t, 'MarketCap': 0})

# Sort list by MarketCap descending

sorted_df = pd.DataFrame(cap_list).sort_values(by='MarketCap', ascending=False)

ordered_tickers = sorted_df['Ticker'].tolist()

print(f"\nSorting complete. Top stock: {ordered_tickers[0]}. Bottom: {ordered_tickers[-1]}.")

# Phase 2: Download Daily Data

start = "1976-01-01"

end = "2026-02-21"

print(f"\nPhase 2: Downloading data for {len(ordered_tickers)} tickers...")

# Download data (this will now find the .DE symbols)

data = yf.download(ordered_tickers, start=start, end=end, auto_adjust=True)["Close"]

# Reindex and Transpose

data = data[ordered_tickers]

df_wide = data.transpose()

df_wide.columns = df_wide.columns.strftime('%Y-%m-%d')

# Save to CSV

file_name = "MSCI_GERMANY_WEIGHTED_DAILY.csv"

df_wide.to_csv(file_name)

print("-" * 30)

print(f"Success! File saved at: {os.getcwd()}/{file_name}")

France Cac40

import pandas as pd

import yfinance as yf

import ssl

import urllib.request

# --- BYPASS SSL CERTIFICATE ISSUES ---

ssl._create_default_https_context = ssl._create_unverified_context

def get_cac40_tickers():

"""

Automated scrape of the CAC 40 constituents from Wikipedia.

Targeting Euronext Paris tickers (.PA).

"""

url = "https://en.wikipedia.org/wiki/CAC_40"

req = urllib.request.Request(url, headers={'User-Agent': 'Mozilla/5.0'})

try:

with urllib.request.urlopen(req) as response:

tables = pd.read_html(response)

# For the CAC 40 page, the constituents table is usually the 4th table (index 3 or 4)

# but we'll find it by looking for the 'Ticker' column.

df = None

for t in tables:

if 'Ticker' in t.columns:

df = t

break

if df is None:

print("Could not find the Ticker column in any table.")

return []

# Format for Yahoo Finance: Most CAC 40 stocks end in .PA

# ArcelorMittal (MT.AS) and Stellantis (STLAP.PA) are handled by the scrape directly

tickers = df['Ticker'].astype(str).tolist()

return tickers

except Exception as e:

print(f"Error fetching CAC 40 list: {e}")

return []

# --- PHASE 1: GET TICKERS & VALIDATE MARKET CAPS ---

tickers = get_cac40_tickers()

if not tickers:

print("CRITICAL: No tickers were retrieved.")

exit()

print(f"Phase 1: Validating {len(tickers)} CAC 40 Tickers and fetching Market Caps...")

cap_list = []

for t in tickers:

try:

stock = yf.Ticker(t)

info = stock.info

m_cap = info.get('marketCap', 0)

# Currency is usually EUR for CAC 40

currency = info.get('currency', 'EUR')

cap_list.append({'Ticker': t, 'MarketCap': m_cap, 'Currency': currency})

print(f"Success: {t} | Cap: {m_cap:,} {currency}")

except Exception:

print(f"FAILED info fetch for: {t}")

cap_list.append({'Ticker': t, 'MarketCap': 0, 'Currency': 'N/A'})

# Sort by Market Cap

sorted_df = pd.DataFrame(cap_list)

if not sorted_df.empty and 'MarketCap' in sorted_df.columns:

sorted_df = sorted_df.sort_values(by='MarketCap', ascending=False)

ordered_tickers = sorted_df[sorted_df['MarketCap'] > 0]['Ticker'].tolist()

else:

print("No valid MarketCap data found.")

exit()

# --- PHASE 2: DOWNLOAD HISTORICAL DATA ---

# Using your requested end date of 2026-03-19

print(f"\nPhase 2: Downloading Daily Data for {len(ordered_tickers)} stocks...")

start = "1976-01-01"

end = "2026-03-19"

data = yf.download(ordered_tickers, start=start, end=end, auto_adjust=True)

if isinstance(data.columns, pd.MultiIndex):

close_data = data['Close']

else:

close_data = data

# Ensure only valid downloaded tickers are included

valid_tickers = [t for t in ordered_tickers if t in close_data.columns]

close_data = close_data[valid_tickers]

# --- PHASE 3: EXPORT ---

df_wide = close_data.transpose()

df_wide.columns = pd.to_datetime(df_wide.columns).strftime('%Y-%m-%d')

file_name = "CAC40_MarketCap_Sorted.csv"

df_wide.to_csv(file_name)

print("-" * 30)

print(f"Done! Exported {len(valid_tickers)} stocks to {file_name}")

Brazil 57

import pandas as pd

import yfinance as yf

import ssl

import numpy as np

# --- BYPASS SSL CERTIFICATE ISSUES ---

ssl._create_default_https_context = ssl._create_unverified_context

def get_brazil_tickers_full():

"""

Comprehensive manual list of the Ibovespa components to ensure

the script never returns an incomplete 'overview'.

"""

# This is the current complete list of the Bovespa (B3) main index

full_list = [

"VALE3.SA", "PETR4.SA", "ITUB4.SA", "PETR3.SA", "BBDC4.SA", "ABEV3.SA",

"WEGE3.SA", "BBAS3.SA", "ITSA4.SA", "B3SA3.SA", "EQTL3.SA", "RENT3.SA",

"PRIO3.SA", "RDOR3.SA", "SUZB3.SA", "VIVT3.SA", "SBSP3.SA", "LREN3.SA",

"GGBR4.SA", "TIMS3.SA", "RADL3.SA", "VBBR3.SA", "UGPA3.SA", "CMIG4.SA",

"RAIL3.SA", "CPLE6.SA", "CSAN3.SA", "HAPV3.SA", "ELET3.SA", "ELET6.SA",

"CCRO3.SA", "CPFE3.SA", "CSNA3.SA", "EMBR3.SA", "KLBN11.SA", "ENGI11.SA",

"EGIE3.SA", "ASAI3.SA", "TOTS3.SA", "ALOS3.SA", "CYRE3.SA", "MULT3.SA",

"SOMA3.SA", "CRFB3.SA", "MRFG3.SA", "BRFS3.SA", "GOAU4.SA", "COGN3.SA",

"AZUL4.SA", "CVCB3.SA", "EZTC3.SA", "MRVE3.SA", "BEEF3.SA", "SMTO3.SA",

"YDUQ3.SA", "PETZ3.SA", "BHIA3.SA", "DXCO3.SA", "MGLU3.SA", "FLRY3.SA",

"ALPA4.SA", "ARZZ3.SA", "RAIZ4.SA", "RECV3.SA", "SLCE3.SA", "VIVA3.SA",

"TRPL4.SA", "POMO4.SA", "SMLS3.SA", "BPAC11.SA", "STBP3.SA", "BRAP4.SA"

]

return full_list

# --- PHASE 1: GET TICKERS & VALIDATE MARKET CAPS ---

print("Phase 1: Validating Full Brazil Ticker List (80+ Stocks)...")

tickers = get_brazil_tickers_full()

cap_data = []

for t in tickers:

try:

stock = yf.Ticker(t)

# Using fast_info for quicker validation

mcap = stock.info.get('marketCap', 0)

if mcap > 0:

cap_data.append({'Ticker': t, 'MarketCap': mcap})

print(f"Added: {t} | {mcap:,.0f} BRL")

else:

# Some tickers like ELET3 sometimes require a re-try or are temporarily blank

print(f"No Cap data for {t}, checking alternative info...")

# Retry one more time with basic info

mcap = stock.history(period="1d")['Close'].iloc[-1] * stock.info.get('sharesOutstanding', 0)

if mcap > 0:

cap_data.append({'Ticker': t, 'MarketCap': mcap})

except:

continue

if not cap_data:

print("CRITICAL: No Market Cap data found.")

exit()

# Sort by Market Cap

df_caps = pd.DataFrame(cap_data).sort_values('MarketCap', ascending=False)

ordered_tickers = df_caps['Ticker'].tolist()

# --- PHASE 2: DOWNLOAD DATA ---

print(f"\nPhase 2: Downloading Daily Data for {len(ordered_tickers)} stocks...")

# Set to today's date

data = yf.download(ordered_tickers, start="1976-01-01", end="2026-03-19", auto_adjust=True)

if isinstance(data.columns, pd.MultiIndex):

close_data = data['Close']

else:

close_data = data

# Clean data: only keep tickers that actually have prices

valid_final_tickers = [t for t in ordered_tickers if t in close_data.columns]

close_data = close_data[valid_final_tickers]

# --- PHASE 3: EXPORT ---

# Transpose so rows = Tickers, columns = Dates

df_wide = close_data.transpose()

df_wide.columns = pd.to_datetime(df_wide.columns).strftime('%Y-%m-%d')

file_name = f"Brazil_MarketCap_Sorted_FULL_OVERVIEW_{len(valid_final_tickers)}.csv"

df_wide.to_csv(file_name)

print("-" * 30)

print(f"Success! Exported {len(valid_final_tickers)} stocks to {file_name}")

Spain 40

import pandas as pd

import yfinance as yf

import ssl

import urllib.request

import numpy as np

# --- BYPASS SSL CERTIFICATE ISSUES ---

ssl._create_default_https_context = ssl._create_unverified_context

def apply_25_50_capping(df_caps):

"""

Applies MSCI 25/50 Rule:

1. No single stock > 25% (Target 22.5% buffer)

2. Sum of all stocks > 5% must be <= 50% (Target 45% buffer)

"""

total_mcap = df_caps['MarketCap'].sum()

df_caps['Weight'] = df_caps['MarketCap'] / total_mcap

df_caps = df_caps.sort_values('Weight', ascending=False).reset_index(drop=True)

for _ in range(100):

# RULE 1: Cap single at 22.5%

excess = 0

for i in range(len(df_caps)):

if df_caps.loc[i, 'Weight'] > 0.225:

excess += df_caps.loc[i, 'Weight'] - 0.225

df_caps.loc[i, 'Weight'] = 0.225

if excess > 0:

uncapped_mask = df_caps['Weight'] < 0.225

df_caps.loc[uncapped_mask, 'Weight'] += excess * (df_caps.loc[uncapped_mask, 'Weight'] / df_caps.loc[uncapped_mask, 'Weight'].sum())

# RULE 2: Group > 5% must be <= 45%

large_weights_mask = df_caps['Weight'] > 0.048

sum_large = df_caps.loc[large_weights_mask, 'Weight'].sum()

if sum_large > 0.45:

excess_large = sum_large - 0.45

df_caps.loc[large_weights_mask, 'Weight'] *= (0.45 / sum_large)

small_weights_mask = ~large_weights_mask

df_caps.loc[small_weights_mask, 'Weight'] += excess_large * (df_caps.loc[small_weights_mask, 'Weight'] / df_caps.loc[small_weights_mask, 'Weight'].sum())

if df_caps['Weight'].max() <= 0.25 and df_caps[df_caps['Weight'] > 0.05]['Weight'].sum() <= 0.50:

break

return df_caps

def get_spanish_tickers():

url = "https://en.wikipedia.org/wiki/IBEX_35"

req = urllib.request.Request(url, headers={'User-Agent': 'Mozilla/5.0'})

try:

with urllib.request.urlopen(req) as response:

tables = pd.read_html(response)

# The constituents table is almost always the one with 'Ticker' or 'Symbol'

# We filter for the table that actually contains Spanish company tickers

for df in tables:

if 'Ticker' in df.columns or 'Symbol' in df.columns:

col = 'Ticker' if 'Ticker' in df.columns else 'Symbol'

# Clean out non-ticker strings (metadata like 'EXCHANGE')

tickers = df[col].astype(str).str.strip()

# Filter out anything that looks like a sentence/header

tickers = [t for t in tickers if len(t) <= 5 and t.isupper()]

if len(tickers) > 20: # IBEX has 35

return [t + ".MC" for t in tickers]

except Exception as e:

print(f"Scrape failed: {e}")

# Solid fallback list of major Spanish tickers

return ["SAN.MC", "IBE.MC", "BBVA.MC", "ITX.MC", "TEF.MC", "REP.MC", "CABK.MC", "FER.MC", "AMS.MC", "SAB.MC"]

# --- EXECUTION ---

print("Phase 1: Fetching and Cleaning Tickers...")

raw_tickers = get_spanish_tickers()

cap_data = []

for t in raw_tickers:

try:

stock = yf.Ticker(t)

mcap = stock.info.get('marketCap')

if mcap and mcap > 0:

cap_data.append({'Ticker': t, 'MarketCap': mcap})

print(f"Found: {t}")

except:

continue

if not cap_data:

print("Error: No market cap data found. Check your internet connection.")

else:

df_caps = pd.DataFrame(cap_data)

print("\nPhase 2: Applying 25/50 Capping Logic...")

df_final = apply_25_50_capping(df_caps)

print("\n--- CONCENTRATION CHECK ---")

print(f"Max Weight: {df_final['Weight'].max()*100:.2f}%")

print(f"Top Group (>5%) Sum: {df_final[df_final['Weight'] > 0.05]['Weight'].sum()*100:.2f}%")

print("\nPhase 3: Downloading Price Data...")

ordered_list = df_final['Ticker'].tolist()

data = yf.download(ordered_list, start="1976-01-01", end="2026-03-19", auto_adjust=True)

if not data.empty:

# Save results

final_prices = data['Close'][ordered_list].transpose()

final_prices.to_csv("MSCI_Spain_Cleaned_2550.csv")

df_final[['Ticker', 'Weight']].to_csv("Spain_Weights_Final.csv", index=False)

print(f"\nSuccess! Exported to 'MSCI_Spain_Cleaned_2550.csv'")

else:

print("Failed to download price data.")

Taiwan 80

import pandas as pd

import yfinance as yf

import ssl

import urllib.request

# --- BYPASS SSL CERTIFICATE ISSUES ---

ssl._create_default_https_context = ssl._create_unverified_context

def get_taiwan_tickers():

"""

Automated scrape of the Taiwan 50 (FTSE TWSE Taiwan 50)

merged with your manual MSCI Taiwan list for maximum completeness.

"""

url = "https://en.wikipedia.org/wiki/FTSE_TWSE_Taiwan_50_Index"

req = urllib.request.Request(url, headers={'User-Agent': 'Mozilla/5.0'})

scraped_tickers = []

try:

with urllib.request.urlopen(req) as response:

tables = pd.read_html(response)

# The constituents table is typically the one with 'Ticker' or 'Symbol'

df = None

for t in tables:

if any(col in t.columns for col in ['Ticker', 'Symbol', 'Stock code']):

df = t

break

if df is not None:

ticker_col = next(col for col in df.columns if col in ['Ticker', 'Symbol', 'Stock code'])

for t in df[ticker_col].astype(str):

clean_t = t.strip()

# Ensure suffix exists. Defaulting to .TW for Taiwan Stock Exchange

if not (clean_t.endswith('.TW') or clean_t.endswith('.TWO')):

clean_t += '.TW'

scraped_tickers.append(clean_t)

except Exception as e:

print(f"Scrape failed (Index page might have moved): {e}")

# Your manual MSCI Taiwan list (approx. 90 tickers)

manual_list = [

"2330.TW", "2317.TW", "2454.TW", "2308.TW", "2881.TW", "2382.TW", "2882.TW", "2412.TW", "2303.TW", "3711.TW",

"2886.TW", "2357.TW", "1301.TW", "2891.TW", "2002.TW", "2301.TW", "1303.TW", "5880.TW", "2884.TW", "2892.TW",

"1216.TW", "2327.TW", "2885.TW", "3008.TW", "2408.TW", "2603.TW", "5871.TW", "2379.TW", "2880.TW", "3045.TW",

"2912.TW", "2883.TW", "1326.TW", "4904.TW", "2395.TW", "2609.TW", "2887.TW", "1101.TW", "2345.TW", "1605.TW",

"2615.TW", "3231.TW", "4938.TW", "2377.TW", "2409.TW", "5876.TW", "3034.TW", "2352.TW", "1402.TW", "2105.TW",

"9910.TW", "2356.TW", "2801.TW", "2618.TW", "3037.TW", "6505.TW", "1504.TW", "2049.TW", "2313.TW", "2360.TW",

"2474.TW", "2890.TW", "3017.TW", "3661.TW", "6669.TW", "1513.TW", "1519.TW", "2376.TW", "2383.TW", "2449.TW",

"3035.TW", "3443.TW", "3532.TW", "4763.TW", "4958.TW", "4966.TW", "5269.TW", "5274.TW", "6239.TW", "6415.TW",

"8046.TW", "8454.TW", "9921.TW", "9945.TW", "2353.TW", "2324.TW", "2633.TW", "1102.TW"

]

return list(set(scraped_tickers + manual_list))

# --- PHASE 1: GET TICKERS & VALIDATE MARKET CAPS ---

tickers = get_taiwan_tickers()

if not tickers:

print("CRITICAL: No tickers were retrieved.")

exit()

print(f"Phase 1: Validating {len(tickers)} Taiwan Tickers and fetching Market Caps...")

cap_list = []

for t in tickers:

try:

stock = yf.Ticker(t)

# TWD is the currency for Taiwan stocks

m_cap = stock.info.get('marketCap', 0)

currency = stock.info.get('currency', 'TWD')

if m_cap > 0:

cap_list.append({'Ticker': t, 'MarketCap': m_cap, 'Currency': currency})

print(f"Success: {t} | Cap: {m_cap:,} {currency}")

else:

print(f"Verified (No Cap data): {t}")

except Exception:

print(f"FAILED fetch for: {t}")

# Sort by Market Cap

sorted_df = pd.DataFrame(cap_list)

if not sorted_df.empty:

sorted_df = sorted_df.sort_values(by='MarketCap', ascending=False)

ordered_tickers = sorted_df[sorted_df['MarketCap'] > 0]['Ticker'].tolist()

else:

print("No valid MarketCap data found.")

exit()

# --- PHASE 2: DOWNLOAD HISTORICAL DATA ---

print(f"\nPhase 2: Downloading Daily Data for {len(ordered_tickers)} stocks...")

start = "1976-01-01"

end = "2026-03-21"

data = yf.download(ordered_tickers, start=start, end=end, auto_adjust=True)

if isinstance(data.columns, pd.MultiIndex):

close_data = data['Close']

else:

close_data = data

# Filter valid and reorder

valid_tickers = [t for t in ordered_tickers if t in close_data.columns]

close_data = close_data[valid_tickers]

# --- PHASE 3: EXPORT ---

df_wide = close_data.transpose()

df_wide.columns = pd.to_datetime(df_wide.columns).strftime('%Y-%m-%d')

file_name = f"Taiwan_MSCI_MarketCap_Sorted_{len(valid_tickers)}.csv"

df_wide.to_csv(file_name)

print("-" * 30)

print(f"Done! Exported {len(valid_tickers)} stocks to {file_name}")

#The two that failed (5274.TW - ASPEED and 4966.TW - Parade Technologies) are common "gotchas" in Taiwan data. Both are primarily listed on the Taipei Exchange (TPEx) rather than the main Taiwan Stock Exchange. On Yahoo Finance, they often require the .TWO suffix instead of .TW. If you ever need those specific semiconductor mid-caps for completeness, just swapping the suffix usually does the trick.

Mexico 40

import pandas as pd

import yfinance as yf

import ssl

import numpy as np

# --- BYPASS SSL CERTIFICATE ISSUES ---

ssl._create_default_https_context = ssl._create_unverified_context

def get_mexico_tickers_full():

"""

Manual list of the S&P/BMV IPC constituents.

These make up the core of the MSCI Mexico 25/50 index.

"""

full_list = [

"AMXB.MX", "WALMEX.MX", "FEMSAUBD.MX", "GFNORTEO.MX", "GMEXICOB.MX",

"CEMEXCPO.MX", "BIMBOA.MX", "ASURB.MX", "GAPB.MX", "OMAB.MX",

"GFINBURO.MX", "GRUMAB.MX", "AC.MX", "KOFUBL.MX", "KIMBERA.MX",

"PINFRA.MX", "ORBIA.MX", "TLEVISACPO.MX", "MEGACPO.MX", "GCC.MX",

"ALFAA.MX", "ALPEKA.MX", "VESTA.MX", "BOLSAA.MX", "RA.MX", "LABB.MX",

"GENTERA.MX", "PE&OLES.MX", "CUERVO.MX", "Q.MX", "CHDRAUIB.MX"

]

return full_list

# --- PHASE 1: GET TICKERS & VALIDATE MARKET CAPS ---

print("Phase 1: Validating Mexico Ticker List (IPC Components)...")

tickers = get_mexico_tickers_full()

cap_data = []

for t in tickers:

try:

stock = yf.Ticker(t)

# Fetching Market Cap in MXN

mcap = stock.info.get('marketCap', 0)

if mcap > 0:

cap_data.append({'Ticker': t, 'MarketCap': mcap})

print(f"Added: {t} | {mcap:,.0f} MXN")

else:

# Fallback for tickers with missing info field

print(f"No direct Cap data for {t}, calculating manually...")

hist = stock.history(period="1d")

if not hist.empty:

shares = stock.info.get('sharesOutstanding', 0)

mcap = hist['Close'].iloc[-1] * shares

if mcap > 0:

cap_data.append({'Ticker': t, 'MarketCap': mcap})

print(f"Added (Manual Calc): {t}")

except Exception as e:

print(f"Skipping {t} due to error: {e}")

continue

if not cap_data:

print("CRITICAL: No Market Cap data found. Check your internet connection.")

exit()

# Sort by Market Cap (Highest to Lowest)

df_caps = pd.DataFrame(cap_data).sort_values('MarketCap', ascending=False)

ordered_tickers = df_caps['Ticker'].tolist()

# --- PHASE 2: DOWNLOAD HISTORICAL DATA ---

print(f"\nPhase 2: Downloading Daily Data for {len(ordered_tickers)} stocks...")

# Start date set to your requested 1976 baseline

start_date = "1976-01-01"

end_date = "2026-03-19"

data = yf.download(ordered_tickers, start=start_date, end=end_date, auto_adjust=True)

# Handle MultiIndex and extract Close prices

if isinstance(data.columns, pd.MultiIndex):

close_data = data['Close']

else:

close_data = data

# Filter only tickers that successfully returned data

valid_final_tickers = [t for t in ordered_tickers if t in close_data.columns]

close_data = close_data[valid_final_tickers]

# --- PHASE 3: EXPORT ---

# Transpose for your target format: Rows = Tickers, Columns = Dates

df_wide = close_data.transpose()

df_wide.columns = pd.to_datetime(df_wide.columns).strftime('%Y-%m-%d')

file_name = f"Mexico_MSCI_2550_Sorted_{len(valid_final_tickers)}.csv"

df_wide.to_csv(file_name)

print("-" * 30)

print(f"Success! Exported {len(valid_final_tickers)} Mexican stocks to {file_name}")

FTSE100 United Kingdom

import pandas as pd

import yfinance as yf

import ssl

import urllib.request # <--- This was the missing piece!

# --- BYPASS SSL CERTIFICATE ISSUES ---

ssl._create_default_https_context = ssl._create_unverified_context

def get_ftse100_tickers():

url = "https://en.wikipedia.org/wiki/FTSE_100_Index"

# Use a User-Agent to prevent 403 Forbidden errors

req = urllib.request.Request(url, headers={'User-Agent': 'Mozilla/5.0'})

try:

with urllib.request.urlopen(req) as response:

tables = pd.read_html(response)

# The constituents list is usually the largest table on this page

df = max(tables, key=len)

# Find the ticker column dynamically (Wikipedia changes names occasionally)

possible_names = ['EPIC', 'Ticker', 'Symbol', 'Stock symbol', 'Ticker symbol']

ticker_col = next((name for name in possible_names if name in df.columns), df.columns[0])

print(f"Found ticker column: {ticker_col}")

# Format for Yahoo Finance: Replace dot with dash and add .L

# e.g., BT.A -> BT-A.L

tickers = df[ticker_col].astype(str).str.replace('.', '-', regex=False) + ".L"

return tickers.tolist()

except Exception as e:

print(f"Error fetching FTSE list: {e}")

return []

# --- PHASE 1: GET TICKERS & VALIDATE WEIGHTS ---

tickers = get_ftse100_tickers()

if not tickers:

print("CRITICAL: No tickers were retrieved. Check internet or SSL settings.")

exit()

print(f"Phase 1: Validating {len(tickers)} FTSE 100 Tickers and fetching Market Caps...")

cap_list = []

for t in tickers:

try:

# Note: This part takes time as it calls the API for each stock

stock = yf.Ticker(t)

info = stock.info

m_cap = info.get('marketCap', 0)

currency = info.get('currency', 'GBP')

cap_list.append({'Ticker': t, 'MarketCap': m_cap, 'Currency': currency})

print(f"Success: {t} | Cap: {m_cap:,} {currency}")

except Exception:

print(f"FAILED info fetch for: {t}")

cap_list.append({'Ticker': t, 'MarketCap': 0, 'Currency': 'N/A'})

# Sort by Market Cap to approximate index weighting

sorted_df = pd.DataFrame(cap_list)

if not sorted_df.empty and 'MarketCap' in sorted_df.columns:

sorted_df = sorted_df.sort_values(by='MarketCap', ascending=False)

ordered_tickers = sorted_df[sorted_df['MarketCap'] > 0]['Ticker'].tolist()

else:

print("No valid MarketCap data found.")

exit()

# --- PHASE 2: DOWNLOAD HISTORICAL DATA ---

print(f"\nPhase 2: Downloading Daily Data for {len(ordered_tickers)} stocks...")

start = "1976-01-01"

end = "2026-03-08"

# Bulk download historical prices

data = yf.download(ordered_tickers, start=start, end=end, auto_adjust=True)

# Handle MultiIndex if necessary and extract Close prices

if isinstance(data.columns, pd.MultiIndex):

close_data = data['Close']

else:

close_data = data

# Reorder columns to match our Market Cap sorting

close_data = close_data[ordered_tickers]

# --- PHASE 3: EXPORT ---

# Transpose so rows are Tickers and columns are Dates

df_wide = close_data.transpose()

df_wide.columns = pd.to_datetime(df_wide.columns).strftime('%Y-%m-%d')

file_name = "FTSE100_MarketCap_Sorted.csv"

df_wide.to_csv(file_name)

print("-" * 30)

print(f"Done! Exported {len(ordered_tickers)} stocks to {file_name}")

Indonesia 40

import pandas as pd

import yfinance as yf

import ssl

import urllib.request

import io

# --- BYPASS SSL CERTIFICATE ISSUES ---

ssl._create_default_https_context = ssl._create_unverified_context

def get_indonesia_complete_list():

"""

Targets LQ45 and EIDO components, ensuring prefixes like 'IDX:' are stripped.

"""

url = "https://en.wikipedia.org/wiki/LQ45"

headers = {'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7)'}

raw_tickers = []

try:

req = urllib.request.Request(url, headers=headers)

with urllib.request.urlopen(req) as response:

tables = pd.read_html(io.BytesIO(response.read()))

df = next(t for t in tables if any('Ticker' in str(col) or 'Code' in str(col) for col in t.columns))

code_col = [col for col in df.columns if 'Ticker' in str(col) or 'Code' in str(col)][0]

raw_tickers = df[code_col].astype(str).tolist()

except Exception as e:

print(f"Auto-fetch failed: {e}")

# Manual Additions for ETF coverage (EIDO/MSCI)

etf_additions = [

"BBCA", "BBRI", "BMRI", "TLKM", "ASII", "BBNI", "BYAN", "AMMN", "TPIA",

"MAPI", "MAPA", "MYOR", "CPIN", "EXCL", "ISAT", "BUKA", "ESSA", "MEDC",

"HRUM", "CTRA", "PWON", "BSDE", "SMRA", "JSMR", "AVIA", "BELI", "MTEL", "TOWR",

"ADRO", "ANTM", "INCO", "UNTR", "KLBF", "UNVR", "ICBP", "INDF", "INKP"

]

combined = list(set(raw_tickers + etf_additions))

# --- CLEANING STEP: Remove 'IDX:' and add '.JK' ---

clean_tickers = []

for t in combined:

clean = t.upper().replace("IDX:", "").strip()

if not clean.endswith(".JK"):

clean += ".JK"

clean_tickers.append(clean)

return list(set(clean_tickers))

# --- PHASE 1: GET TICKERS & VALIDATE ---

tickers = get_indonesia_complete_list()

print(f"Phase 1: Validating {len(tickers)} Indonesia Tickers (Sanitized)...")

cap_list = []

for t in tickers:

try:

stock = yf.Ticker(t)

m_cap = stock.info.get('marketCap', 0)

if m_cap > 0:

cap_list.append({'Ticker': t, 'MarketCap': m_cap})

print(f"Success: {t} | Cap: Rp{m_cap:,.0f}")

else:

# Fallback for stocks that have data but no 'info' cap

hist = stock.history(period="1d")

if not hist.empty:

cap_list.append({'Ticker': t, 'MarketCap': 0})

print(f"Success (History Only): {t}")

except:

continue

# Sort by Market Cap

sorted_df = pd.DataFrame(cap_list).sort_values(by='MarketCap', ascending=False)

ordered_tickers = sorted_df['Ticker'].tolist()

# --- PHASE 2: DOWNLOAD HISTORICAL DATA ---

print(f"\nPhase 2: Downloading Daily Data for {len(ordered_tickers)} stocks...")

start, end = "1976-01-01", "2026-03-21"

data = yf.download(ordered_tickers, start=start, end=end, auto_adjust=True)

close_data = data['Close'] if isinstance(data.columns, pd.MultiIndex) else data

# --- PHASE 3: EXPORT ---

df_wide = close_data.transpose()

df_wide.columns = pd.to_datetime(df_wide.columns).strftime('%Y-%m-%d')

file_name = f"Indonesia_ETF_Full_Sanitized_{len(ordered_tickers)}.csv"

df_wide.to_csv(file_name)

print("-" * 30)

print(f"Done! Exported {len(ordered_tickers)} stocks to {file_name}")

MSCI Italy 40

import pandas as pd

import yfinance as yf

import ssl

import urllib.request

# --- BYPASS SSL CERTIFICATE ISSUES ---

ssl._create_default_https_context = ssl._create_unverified_context

def get_italy_tickers():

"""

Automated scrape with 'Smart Suffix' logic to prevent .MI.MI errors.

"""

url = "https://en.wikipedia.org/wiki/FTSE_MIB"

req = urllib.request.Request(url, headers={'User-Agent': 'Mozilla/5.0'})

scraped_tickers = []

try:

with urllib.request.urlopen(req) as response:

tables = pd.read_html(response)

df = None

for t in tables:

if any(col in t.columns for col in ['Ticker', 'Ticker symbol', 'Symbol']):

df = t

break

if df is not None:

ticker_col = next(col for col in df.columns if col in ['Ticker', 'Ticker symbol', 'Symbol'])

for t in df[ticker_col].astype(str):

clean_t = t.strip()

# Only add .MI if it's not already there

if not clean_t.endswith('.MI'):

clean_t += '.MI'

scraped_tickers.append(clean_t)

except Exception as e:

print(f"Scrape failed: {e}")

# Refined manual list (Corrected BPE and removed redundancy)

manual_list = [

"ENI.MI", "ENEL.MI", "ISP.MI", "UCG.MI", "RACE.MI", "STLAM.MI", "STMMI.MI",

"G.MI", "MONC.MI", "PRY.MI", "TRN.MI", "SRG.MI", "PST.MI", "TEN.MI",

"LDO.MI", "MB.MI", "FBK.MI", "AMP.MI", "REC.MI", "DIA.MI", "NEXI.MI",

"BAMI.MI", "BPE.MI", "TIT.MI", "AZM.MI", "SPM.MI", "INW.MI", "ERG.MI",

"ITM.MI", "PIRC.MI", "BRE.MI"

]

# Combine lists and remove duplicates

return list(set(scraped_tickers + manual_list))

# --- PHASE 1: GET TICKERS & VALIDATE MARKET CAPS ---

tickers = get_italy_tickers()

if not tickers:

print("CRITICAL: No tickers were retrieved.")

exit()

print(f"Phase 1: Validating {len(tickers)} Italy Tickers and fetching Market Caps...")

cap_list = []

for t in tickers:

try:

stock = yf.Ticker(t)

info = stock.info

m_cap = info.get('marketCap', 0)

currency = info.get('currency', 'EUR')

if m_cap > 0:

cap_list.append({'Ticker': t, 'MarketCap': m_cap, 'Currency': currency})

print(f"Success: {t} | Cap: {m_cap:,} {currency}")

except Exception:

print(f"FAILED info fetch for: {t}")

# Sort by Market Cap

sorted_df = pd.DataFrame(cap_list)

if not sorted_df.empty:

sorted_df = sorted_df.sort_values(by='MarketCap', ascending=False)

ordered_tickers = sorted_df['Ticker'].tolist()

else:

print("No valid MarketCap data found.")

exit()

# --- PHASE 2: DOWNLOAD HISTORICAL DATA ---

print(f"\nPhase 2: Downloading Daily Data for {len(ordered_tickers)} stocks...")

start = "1976-01-01"

end = "2026-03-21" # Current date

data = yf.download(ordered_tickers, start=start, end=end, auto_adjust=True)

if isinstance(data.columns, pd.MultiIndex):

close_data = data['Close']

else:

close_data = data

# Filter and reorder

valid_tickers = [t for t in ordered_tickers if t in close_data.columns]

close_data = close_data[valid_tickers]

# --- PHASE 3: EXPORT ---

df_wide = close_data.transpose()

df_wide.columns = pd.to_datetime(df_wide.columns).strftime('%Y-%m-%d')

file_name = f"Italy_MarketCap_Sorted_{len(valid_tickers)}.csv"

df_wide.to_csv(file_name)

print("-" * 30)

print(f"Done! Exported {len(valid_tickers)} stocks to {file_name}")

Portugal 20

import pandas as pd

import yfinance as yf

import ssl

import urllib.request

# --- BYPASS SSL CERTIFICATE ISSUES ---

ssl._create_default_https_context = ssl._create_unverified_context

def get_portugal_tickers():

"""

Automated scrape of the PSI (Portugal) constituents from Wikipedia

with 'Smart Suffix' logic for the Lisbon (.LS) exchange.

"""

url = "https://en.wikipedia.org/wiki/PSI_20"

req = urllib.request.Request(url, headers={'User-Agent': 'Mozilla/5.0'})

scraped_tickers = []

try:

with urllib.request.urlopen(req) as response:

tables = pd.read_html(response)

# Find the table containing ticker symbols

df = None

for t in tables:

if any(col in t.columns for col in ['Ticker', 'Symbol', 'Ticker symbol']):

df = t

break

if df is not None:

ticker_col = next(col for col in df.columns if col in ['Ticker', 'Symbol', 'Ticker symbol'])

for t in df[ticker_col].astype(str):

clean_t = t.strip().upper()

# Ensure single .LS suffix

if not clean_t.endswith('.LS'):

clean_t += '.LS'

scraped_tickers.append(clean_t)

except Exception as e:

print(f"Scrape failed: {e}")

# Your manual list from the image (16 tickers)

manual_list = [

"ALTR.LS", "BCP.LS", "COR.LS", "CTT.LS", "EDP.LS", "EDPR.LS",

"GALP.LS", "IBS.LS", "JMT.LS", "EGL.LS", "NOS.LS", "NVG.LS",

"PHR.LS", "RENE.LS", "SEM.LS", "SON.LS"

]

# Merge and remove duplicates

return list(set(scraped_tickers + manual_list))

# --- PHASE 1: GET TICKERS & VALIDATE MARKET CAPS ---

tickers = get_portugal_tickers()

if not tickers:

print("CRITICAL: No tickers were retrieved.")

exit()

print(f"Phase 1: Validating {len(tickers)} Portugal Tickers and fetching Market Caps...")

cap_list = []

for t in tickers:

try:

stock = yf.Ticker(t)

info = stock.info

m_cap = info.get('marketCap', 0)

currency = info.get('currency', 'EUR')

# Note: Pharl (PHR.LS) sometimes returns 0 cap if suspended/OTC

if m_cap > 0:

cap_list.append({'Ticker': t, 'MarketCap': m_cap, 'Currency': currency})

print(f"Success: {t} | Cap: {m_cap:,} {currency}")

else:

# Add with 0 so it's still in the dataframe but sorted to bottom

cap_list.append({'Ticker': t, 'MarketCap': 0, 'Currency': currency})

print(f"Verified (No Cap): {t}")

except Exception:

print(f"FAILED info fetch for: {t}")

# Sort by Market Cap

sorted_df = pd.DataFrame(cap_list)

if not sorted_df.empty:

sorted_df = sorted_df.sort_values(by='MarketCap', ascending=False)

# We filter out 0 for the final ordered list to keep the data clean

ordered_tickers = sorted_df[sorted_df['MarketCap'] > 0]['Ticker'].tolist()

else:

print("No valid data found.")

exit()

# --- PHASE 2: DOWNLOAD HISTORICAL DATA ---

print(f"\nPhase 2: Downloading Daily Data for {len(ordered_tickers)} stocks...")

start = "1976-01-01"

end = "2026-03-21"

data = yf.download(ordered_tickers, start=start, end=end, auto_adjust=True)

if isinstance(data.columns, pd.MultiIndex):

close_data = data['Close']

else:

close_data = data

valid_tickers = [t for t in ordered_tickers if t in close_data.columns]

close_data = close_data[valid_tickers]

# --- PHASE 3: EXPORT ---

df_wide = close_data.transpose()

df_wide.columns = pd.to_datetime(df_wide.columns).strftime('%Y-%m-%d')

file_name = f"Portugal_PSI_MarketCap_Sorted_{len(valid_tickers)}.csv"

df_wide.to_csv(file_name)

print("-" * 30)

print(f"Done! Exported {len(valid_tickers)} stocks to {file_name}")

Nasdac 100

import pandas as pd

import yfinance as yf

import ssl

import urllib.request

import io

# --- BYPASS SSL CERTIFICATE ISSUES ---

ssl._create_default_https_context = ssl._create_unverified_context

def get_nasdaq_100_tickers():

"""

Automated fetch from Wikipedia with a User-Agent header

to prevent 403 Forbidden errors.

"""

url = "https://en.wikipedia.org/wiki/Nasdaq-100"

# Adding a header to mimic a standard browser

headers = {

'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/91.0.4472.124 Safari/537.36'

}

try:

req = urllib.request.Request(url, headers=headers)

with urllib.request.urlopen(req) as response:

content = response.read()

# Parse the HTML content specifically for the constituents table

tables = pd.read_html(io.BytesIO(content))

# Usually the table is at index 4, but we search for the 'Ticker' column to be safe

df = None

for t in tables:

if 'Ticker' in t.columns:

df = t

break

if df is not None:

return df['Ticker'].tolist()

else:

print("Could not find the ticker table in Wikipedia.")

return []

except Exception as e:

print(f"Automated Wikipedia fetch failed: {e}")

return []

# --- PHASE 1: GET TICKERS & VALIDATE ---

tickers = get_nasdaq_100_tickers()

if not tickers:

print("CRITICAL: No tickers were retrieved.")

exit()

print(f"Phase 1: Validating {len(tickers)} Nasdaq-100 Tickers...")

cap_list = []

for t in tickers:

try:

stock = yf.Ticker(t)

# Market Cap is in USD for Nasdaq stocks

m_cap = stock.info.get('marketCap', 0)

if m_cap > 0:

cap_list.append({'Ticker': t, 'MarketCap': m_cap})

print(f"Success: {t} | Cap: ${m_cap:,.0f}")

else:

print(f"Verified (No Cap data): {t}")

except Exception:

print(f"FAILED fetch for: {t}")

# Sort by Market Cap (Highest to Lowest)

sorted_df = pd.DataFrame(cap_list)

if not sorted_df.empty:

sorted_df = sorted_df.sort_values(by='MarketCap', ascending=False)

ordered_tickers = sorted_df['Ticker'].tolist()

else:

print("No valid data found.")

exit()

# --- PHASE 2: DOWNLOAD HISTORICAL DATA ---

print(f"\nPhase 2: Downloading Daily Data for {len(ordered_tickers)} stocks...")

start = "1976-01-01"

end = "2026-03-21"

# Bulk download (Threads=True for speed)

data = yf.download(ordered_tickers, start=start, end=end, auto_adjust=True)

# Select 'Close' prices

if isinstance(data.columns, pd.MultiIndex):

close_data = data['Close']

else:

close_data = data

# Ensure we only export tickers that actually returned data

valid_tickers = [t for t in ordered_tickers if t in close_data.columns]

close_data = close_data[valid_tickers]

# --- PHASE 3: EXPORT ---

# Transpose so tickers are rows and dates are columns

df_wide = close_data.transpose()

df_wide.columns = pd.to_datetime(df_wide.columns).strftime('%Y-%m-%d')

file_name = f"Nasdaq100_MarketCap_Sorted_{len(valid_tickers)}.csv"

df_wide.to_csv(file_name)

print("-" * 30)

print(f"Done! Exported {len(valid_tickers)} Nasdaq-100 stocks to {file_name}")

>450 LSMW Pricing records uploaded in last 2 year work experience