Coronavirus et modélisation
dans Statistiques
hello
pas évident de modéliser cette épidemie de covid-19 et donc de faire des prévisions plus ou moins fiable
Mais on peut se baser par exemple sur la mortalité en France dans les hopitaux (hors Ehpad) du 11 mars au 11 avril
au 3/05/2020 on a 15.564 décès dans les hopitaux français dûs à ce virus
au 11 mars il y en avait 61
et tenter de répondre à la question : quelle estimation au 11 mai ?
on pose une première courbe v1 avec
m : 25
n : 472
sigma : 8,5
on pose une deuxième courbe v2 avec
m: 42
n: 280
sigma : 8,5
(m=25 correspond au 4/04 et m =42 au 24/04)
avec x=1 au 11/03/2020 et x=62 au 11/05/2020
on calcule n*PUISSANCE(EXP(1);PUISSANCE((x-m)/sigma;2)*-0,5) pour v1 et v2
on cumule le résultat v1+v2 en une seule courbe
cela donne au 3/05 un recalcul de 15.579 pour 15.564 réel
au 11/05 l'estimation est de 15.955 quasi fin de l'épidemie en ce qui concerne cette mortalité en hopital
comme on peut le voir sur le graphique joint, la correspondance entre données réelles et le modèle est assez correcte
cette courbe de mortalité est donc le cumul de 2 cloches gaussiennes et explique bien le plateau et la disymétrie à droite de la courbe
pour la source : https://mapthenews.maps.arcgis.com/apps/opsdashboard/index.html#/5df19abcf8714bc590a3b143e14a548c
pas évident de modéliser cette épidemie de covid-19 et donc de faire des prévisions plus ou moins fiable
Mais on peut se baser par exemple sur la mortalité en France dans les hopitaux (hors Ehpad) du 11 mars au 11 avril
au 3/05/2020 on a 15.564 décès dans les hopitaux français dûs à ce virus
au 11 mars il y en avait 61
et tenter de répondre à la question : quelle estimation au 11 mai ?
on pose une première courbe v1 avec
m : 25
n : 472
sigma : 8,5
on pose une deuxième courbe v2 avec
m: 42
n: 280
sigma : 8,5
(m=25 correspond au 4/04 et m =42 au 24/04)
avec x=1 au 11/03/2020 et x=62 au 11/05/2020
on calcule n*PUISSANCE(EXP(1);PUISSANCE((x-m)/sigma;2)*-0,5) pour v1 et v2
on cumule le résultat v1+v2 en une seule courbe
cela donne au 3/05 un recalcul de 15.579 pour 15.564 réel
au 11/05 l'estimation est de 15.955 quasi fin de l'épidemie en ce qui concerne cette mortalité en hopital
comme on peut le voir sur le graphique joint, la correspondance entre données réelles et le modèle est assez correcte
cette courbe de mortalité est donc le cumul de 2 cloches gaussiennes et explique bien le plateau et la disymétrie à droite de la courbe
pour la source : https://mapthenews.maps.arcgis.com/apps/opsdashboard/index.html#/5df19abcf8714bc590a3b143e14a548c
Connectez-vous ou Inscrivez-vous pour répondre.
Réponses
Le coronavirus défie les prévisions. Chaque vague en cache une autre. Jusqu’au 4 avril, une seule vague aurait suffi : le pic atteignait 514 (sur une moyenne mobile à 7 jours) et le calcul donnait 502. Le cumul réel se situait à 5532 pour un calcul à 5417. Donc un ajustement des données qui était très correct. Mais quelques jours après cette date un plateau se forme. Il faut alors ajouter une deuxième vague pour que les prévisions s’ajustent sur les données réelles. Ça va marcher quelques semaines mais vers la fin avril, un autre plateau s’installe. Et il faut ajouter une troisième vague pour compenser. C’est vraiment sournois, parce que les effets d’une nouvelle vague sont infimes dans les 8, 10 premiers jours.
Cela se voit en regardant la courbe des ronds bleus évidés : elle ondule en descendant, on voit bien deux bosses. Ces bosses correspondent exactement au sommet des trois vagues.
Evidemment à chaque fois qu’on ajoute une vague, la prévision finale des décès en hôpitaux repart à la hausse : 16.914 au 20 mai. La première vague aurait donné ‘’seulement’’ 10.303 morts en se finissant au 4 mai. En ajoutant la deuxième, on aurait eu 14.589 au 11 mai. La troisième vague ajoute donc 2085 décès et nous emmène au 20 mai à 16.914.
S’il existe une formule pour chaque vague avec pour paramètre m le jour du pic, n le nombre de décès le jour du pic, et sigma l’étendue de la vague, il en faudrait une nouvelle pour générer un modèle à plusieurs vagues.
Par exemple.
10 mai : 70 morts
11 mai : 263 morts
12 mai : 348 morts
13 mai : 83 morts
14 mai : 351 morts.
15 mai : 104 morts.
J'ai tendance à penser que cela vient des remontées qui sont irrégulières. Parce que sinon d'un point de vue statistique j'ai du mal à comprendre comment on peut avoir 4 fois plus de morts d'un jour sur l'autre par exemple. Qu'en pensez-vous ?
On sait qu'il y a des fluctuations dans les enregistrements. Mais il peut aussi y avoir des fluctuations statistiques importantes. C'est même une situation fréquente dans les statistiques concrètes, qui ne respectent pas les modèles simples que les probas nous ont habitué à imaginer. Je montrais cela à mes classes de BTS en leur faisant lancer des séries de 2 pièces (une cinquantaine de fois 2 pièces pour chaque binôme - bruyant, mais efficace). Certains avaient autant de 2P que de 1P 1F, alors que la théorie statistique dit "moitié moins".
Et le résultat du 13 mai, en pleine semaine, ne semble pas relever d'un défaut de déclarations (plutôt le week-end); à moins que tu voies une raison ?
Cordialement.
NB : les décès actuels sont surtout des malades de avril.
Ils correspondront probablement à des gens qui ont été infectés après le déconfinement.
Une hausse régulière soutenue serait une encore plus mauvaise nouvelle que d'habitude
c'est normal, les services administratifs des hôpitaux sont en effectif très réduit, la priorité n'est pas aux statistiques.
Cordialement.
Les chiffres quotidiens, mais par région et non pas au niveau national, ça permettrait de comprendre si c'est un décalage dans certaines déclarations, ou la faute au hasard.
dimanche 17 mai 483 décès, 400% d'augmentation par rapport à la veille...
La série des points rouges est rompue.
je prends les données de mortalité en hopitaux (hors ehpad donc) du covid 19,
je leur applique une moyenne mobile sur 7 jours, centrée (le jour de ref de la MM est au milieu des 7J) : cela me donne les points à matcher,
je prends bien sur aussi en référence le cumul officiel des décès.
Comment trouver un modéle qui suit ces courbes ? voici ma solution :
je génére une série de v1, v2, v3, v4 telles que
v =n*PUISSANCE(EXP(1);PUISSANCE((x-m)/sigma;2)*-0,5)
avec x = 1 correspondant au 11/03/2020 et x = 97 correspondant au 15/06/2020,
les valeurs m, n, sigma pour v1, v2, v3, v4 étant :
m : 25, 41, 57, 69
n : 504, 285, 145, 65
sigma : 8, 6.5, 7, 4
Les graphiques montrent un ''curve matching '' plutot correct. Ces 4 sous-courbes sont donc l'explication de la forme de la courbe générale des données réelles, à la fois pour sa montée, mais aussi pour sa longue descente présentant une succession de bosses.
Si cela tente quelqu'un de réunir le calcul des v1, v2, v3, v4 en une seule expression (voire pour n sous-courbes) je suis preneur.
Pour la petite histoire, je me suis risqué au jeu des prévisions au fur et à mesure de la progression du covid 19. Je me suis planté à chaque fois parce que l'arrivée d'une nouvelle sous-courbe est indécelable tant que la sous-courbe précédente n'a pas passé son pic de quelques jours. Donc pour la qualité prévisionnelle on repassera, sauf à d'emblée tenter n sous-courbes en essayant d'apprecier leurs paramètres au pif total.
Si les prévisions de mon modèle ne sont pas bonnes, c'est que le gouvernement ment sur les chiffres réels de décès!!
mode Pablo OFF
(LOL)
Noter que le pic des décès a eu lieu le 7 avril. On estime que les décès ont lieu en moyenne environ 22 jours après la contamination, ce qui place le pic de contaminations vers le 16 mars : c'est cohérent avec la date du début de confinement. La baisse n'est pas brutale (le pic n'est pas anguleux), d'une part parce que les mesures de confinement sont venues en plusieurs étapes (interdictions de rassemblements, puis fermeture des écoles, puis confinement total), et d'autre part parce que le temps entre la contamination et le décès n'est pas fixe.
Le modèle de base en épidémiologie est le modèle SIR, qui ne donne pas une courbe gaussienne. Il y a d'autres modèles plus élaborés (modèle SEIR, etc.) qui y ressemblent, et qui ne donnent pas de gaussienne non plus.
En effet :
;-)
Maintenant la question qui se pose est : le déconfinement provoquera-t-il une seconde vague ? Et là la réponse me semble être : p'têt ben qu'oui, p'têt ben qu'non.
le modèle de prétend pas à être DPLG
Disons que ces sommes gaussiennes comme tu dis ont l'avantage d'être facilement implémentables et avec un peu de mécanique dans Excel on devrait pouvoir les manipuler avec un seul jeu de paramètres. C'est du curve matching ou une manière de lisser des données tout en restant assez bien coller sur les variations réelles.
Un modèle de mélange gaussien (usuellement abrégé par l'acronyme anglais GMM pour Gaussian Mixture Model) est un modèle statistique exprimé selon une densité mélange. Il sert usuellement à estimer paramétriquement la distribution de variables aléatoires en les modélisant comme une somme de plusieurs gaussiennes (appelées noyaux).
c'est pour cela que j'ai employé une moyenne mobile sur 7 jours pour avoir une référence plus stable
à part ça, cela n'a rien de bizarre : les décès peuvent varier pas mal d'une journée à l'autre,
de plus il y a des recalages entre les données aux infos chauqe soir et celles qui sont recorrigés plus tard :
https://mapthenews.maps.arcgis.com/apps/opsdashboard/index.html#/5df19abcf8714bc590a3b143e14a548c
Il y aura une deuxième vague, la vraie question est de savoir si elle va faire bondir le nombre de décès significativement et si elle va provoquer un engorgement du système de santé (c'est toujours la même problématique)
La seule chose qui a gêné jusqu'à aujourd'hui la propagation du virus est le grand confinement, rien d'autre.
Est-ce que la société est prête à un nouveau confinement? Probablement que non.
La préoccupation du moment des gens que je connais est de savoir s'ils pourront aller à la plage cet été.
Je pense qu'on va hélas atteindre les 100 000 morts car l'infection va s'incruster dans le paysage de nos vies.
.
Tu as bien de la chance, moi la préoccupation de la majorité des gens que je connais est de savoir ce qu'ils vont devenir. Car ce confinement les a mis dans des situations pas simples voire franchement critiques. La plage est vraiment le cadet de leur souci.
Il y a à mon avis beaucoup d'autres facteurs inconnus dans ces histoires, peut-être que par exemple l'indice uv ou la pollution jouent aussi un rôle, sans doute plus que la chaleur. Il y a beaucoup de mystères à élucider.
J'avais prédit 30.000 morts officiels plus 30.000 d'origine ''douteuse'' (que l'on découvrira peut-être bien plus tard) et je pense (j'espère...) qu'on en restera dans ces proportions (du moins pour le nombre officiel ...).
Quant à l'immunité, la question semble plus complexe que le simple rapport 1-1/R car le pays n'est pas homogène, le fait d'être plus ou moins susceptible de transmettre la maladie dépend peut-être de l'âge... Il y a aussi le fait que certaines personnes transmettent beaucoup plus la maladie que d'autres ("superspreaders"), donc c'est peut-être l'immunité au sein de la population des "superspreaders" qui importe plus que celle au sein de la population générale... Bref il y a beaucoup d'inconnues, c'est difficile d'avoir une modélisation qui prédit l'avenir de manière fiable. Par contre pour prédire le passé on devrait y arriver.
L'une des personnes dont je parlais est ma soeur qui est fonctionnaire de l'éducation nationale (personnel non enseignant)
Par manque d'argent, elle n'a pas pu partir en vacances l'année dernière elle est restée chez elle (avec son mari).
Je sais que cela peut choquer mais il y a beaucoup de gens qui se demandent s'ils vont pouvoir s'éloigner de plus de 100km de leur domicile pour aller en vacances. (cela intéresse accessoirement aussi les gens qui vivent du tourisme)
Le déconfinement devrait même faire qu'on va rester dans des niveaux similaires ou un peu plus élevés. On en est à 28000 décès aujourd'hui, on pourrait finir l'année aux environs de 60000. Peut-être 100000 pour reprendre le chiffre de FdP.
En terme de surmortalité, ce sera beaucoup moindre. Disons 30000 ou 40000. 50000 si le pronostic de FdP s'avère juste.
La vraie question, c'est à quoi ressemblera notre vie dans 6 mois ou dans 1 an ? Des écoles ouvertes normalement ? Des magasins où on peut entrer plus ou moins librement ?
Des écoles ouvertes normalement, je n'y crois pas. Et des écoles pas ouvertes normalement, j'imagine très mal.
Je pense que tu connais déjà les réponses. La covid19 va s'installer durablement dans nos vies et il est craindre que seul un vaccin efficace nous en débarrasse*. Comme déjà indiqué par d'autres ici, ce n'est peut-être pas ce qui va préoccuper le plus des gens dans les mois qui viennent (et là pour le coup je ne parle plus de vacances à la mer).
*: et il y a une telle défiance dans la population pour les vaccins que beaucoup de gens vont refuser de se faire vacciner.
(J'étais volontaire pour le vaccin H1N1 et mon vaccin est parti à la poubelle avant que ce ne soit mon tour, alors que les centres de vaccination étaient vides. On serait prêt à refaire de même. C'est magnifique d'imbécilité. )
Le fait social intervient, les modalités des échanges sociaux des peuples sur terre peuvent varier d'une nation à l'autre. Par exemple, il me semble qu'il avait été mis en évidence que la distance entre deux individus dans des conditions normales est une donnée culturelle: une trop grande proximité physique des autres est jugée agressive par des peuples, tandis que d'autres n'ont pas ces réticences.
Je ne sais pas s'il est bien vu socialement de se tenir à seulement un mètre d'un Japonais pour lui parler. Je doute qu'ils se claquent la bise spontanément (les Nord-Américains ne me semblent pas non plus friands de cette pratique sociale) et que le serrage de mains soit leur tasse de thé*.
Par ailleurs, le port du masque était une pratique sociale déjà répandue bien avant cette crise sanitaire dans le monde asiatique me semble-t-il. En France, c'est une pratique qu'on n'aime guère et pour laquelle on doit se faire violence pour l'appliquer (il y a des gens qui ne l'ont pas encore adoptée, ils font un blocage)
*: est-ce que les jeunes Japonais se regroupent au bord de fleuves pour faire des bouffes et boire ensemble?
Les japonais vont aussi dans les bars et les restaurants.
il faut se méfier du modèle suédois.
Si leurs statistiques sont fiables et qu'ils atteignent l'immunité collective sans hécatombe, alors il faudrait d'urgence comprendre les causes d'un faible taux de létalité, mais il est plus probable que le miracle soit en grande partie un mirage.
On ne peux que s'interroger lorsqu'on lit ceci de la part d'un épidémiologiste aux manettes:
«Je pense que, dans les grandes lignes, nous avons réussi à faire ce que nous voulions, a récemment déclaré Tegnell à la BBC. Ce qui est moins bon, en revanche, c'est le taux de mortalité, mais c'est à peu près tout –je veux dire que c'est en partie dû à la stratégie, mais pas vraiment tant que ça. Cela s'explique principalement par le fait que nos établissements pour personnes âgées n'ont pas été capables de maintenir la maladie hors de leurs murs.»
En gros, "nos chiffres sont mauvais, mais c'est de la faute des EHPAD qui n'ont pas su protéger leurs résidents".
article de Slate
https://judithcurry.com/2020/05/10/why-herd-immunity-to-covid-19-is-reached-much-earlier-than-thought/?fbclid=IwAR3gfphbnDt3IeyPsFz4f_yPGW1e-EFhz9kAn8PQDqi1tbsJ9-R2bURyTrs
Cordialement.
Ajout : je n'avais pas vu l'article de "Slate". Là, on part sur de bonnes bases scientifiques..
Quelqu'un sait-il comment le comité scientifique dédié a-t-il pu conseiller le gouvernement français ?
Cordialement.
ce modèle est très proche d'un modèle de mélange gaussien
https://fr.wikipedia.org/wiki/Modèle_de_mélange_gaussien
très pratique en tous cas et bonne application sur Excel (parce que très facile) pour caractériser ce type de courbe
coté qualité prévisionnelle : c'est juste jusqu'à ce que ce soit faux
en blaguant moins : le modèle ne détectant pas la prochaine gaussienne, il est battu dès qu'elle commence à avoir de l'influence, généralement quelques jours après le pic de la précédente.
https://covid19.healthdata.org/france
si je compare dans le modèle Daily deaths (en onglet TRENDS) je vois que leur prévisionnel est en pente très douce sur bcp de jours
Le mien se termine plus abrutement
conclusion : il faudrait que j'ajoute plein de gaussiennes de plus en plus petites si je veux avoir cet effet
Ben non ! ;-)
Ah oui ?
Rien d'autre ? Ce n'est pas ce que disent tous les gens qui ont bac +10 en médecine. Tu es forcément plus calé qu'eux.
Cordialement.
Cordialement.