vers une DSI++: La sauvegarde, bilan de santé du SI ?

Après quelques péripéties sur la sauvegarde, voici quelques réflexions….

1/La sauvegarde permet de s’assurer de la cohérence des données. Si la sauvegarde complète du SI fonctionne, cela est déjà très positif! Car cela indique que toutes les données éparpillées partout sont lisibles.

2/L’évolution du temps de sauvegarde indique une tendance. S’il vous faut de plus en plus de temps pour sauvegarder un volume de données à peu près identique, cela indique une baisse de forme du SI. La sauvegarde peut être un exercice intense, car il s’agit de transférer un maximum de données en un minimum de temps. Cela test donc à la fois la capacité de lecture des différentes sources (SAN, AS/400…) et le backbone réseau.
On peut comparer la sauvegarde à une course de vitesse, où les dépôts de données sont les muscles et le réseau le sang circulant dans les veines. En cas de baisse de forme, il convient de diagnostiquer en détail ce qui ralentit. La fragmentation des disques durs est une raison fréquente, mais le service pack 2 de Windows 2003 a quelques effets sur les performances réseaux à ne pas négliger..

3/ L’expérience tend à montrer qu’une des premières briques du SI à se dégrader est la sauvegarde. Cela commence par une augmentation de la fenêtre de sauvegarde, puis des avertissements sur des fichiers non sauvegardés. Et là, alors que vous ne voulez toujours pas vous occuper de ces trop nombreux avertissements, une partition du serveur de fichiers principal lâche, d’un coup d’un seul… Enfin, c’est ce que l’on pense au début..Car on se rend compte que la sauvegarde se plaint depuis 15 jours de ne plus pouvoir sauvegarder des fichiers, de façon de plus en plus nombreux. Seulement voilà, il est trop tard, là où vous aviez un seul caillou dans la chaussure, vous avez d’un coup un menhir! Si je résume:

T0: tout va bien…
T1:tout va bien sauf quelques avertissements sur quelques fichiers, vous passez votre chemin..
T2:de plus en plus de fichiers non sauvegardés, mais bon « ce n’est qu’un avertissement » (laisser mariner 15 jours la situation…)
T3: Toute la partition est corrompue!

Sauf que maintenant, vous avez 15 jours de sauvegardes aussi complets qu’un emmental. Alors qu’il suffirait normalement de restaurer les données de la veille, ces données ne valent rien. Expliquer à son DSI et plus haut qu’une panne fait perdre une journée de travail, c’est déjà dur, mais lui expliquer que c’est 15 jours qui sont perdus…Pas la même histoire.

On peut alors se poser la question « pourquoi ne pas avoir traité ces avertissements? »
Sur un SI un peu évolué, avec une centaine de serveurs, il est très difficile d’avoir toutes les sauvegardes de tous les serveurs sans aucun avertissement. Il y a toujours un serveur pour faire parler de lui le matin au rapport d’exploitation. D’une part, les personnes en charge prenne l’habitude de voir quelques avertissements qui vont et viennent. Ils ne se formalisent plus en dessous du mot « échec ». Je pense que le terme « avertissement » n’est pas approprié est amène les administrateurs à penser que cela va suffisamment bien pour ne pas s’inquiéter.
La sauvegarde est un sujet ingrat, comme un vaccin. Il n’intéresse personne jusqu’à ce qu’il y en ait besoin. Et là personne ne comprends que la sauvegarde de la veille n’ait pas fonctionné, sans chercher plus en détail les causes profondes du maux.

Quelques conseils pour une DSI++:

  • Ne rien lâcher, traiter les avertissements comme un échec. Ne rien laisser entraver le bon déroulement de la sauvegarde. Arrêter cette ancienne application tous les soirs s’il le faut.
  • Historier tous les temps de sauvegardes (et volumétrie). Générer un rapport mensuel sur les performances des 6 derniers mois.
  • Faire un test de restauration au moins tous les mois, toujours sur un élément différent.

La sauvegarde est la dernière chose à fonctionner, et la première à tomber.

System Center Operation Manager 2007: collation de l’instance SQL Server 2005

Que fût ma déception, de découvrir que SCOM 2007 impose que l’instance SQL soit en SQL_Latin1_General_CP1_CS_AS.
Oui, vous avez bien lu, l’instance elle même doit avoir cette collation précisément, et non juste les bases SCOM…
Le setup que nous souhaitions:
Instance SQL Server (collation: French_CI_AS)
TempDB (collation: French_CI_AS)
OP DB (collation: SQL_Latin1_General_CP1_CS_AS)
DWH DB (collation: SQL_Latin1_General_CP1_CS_AS)
(Ce setup sur notre maquette n’a pas posé de problème pour l’instant)

Pourquoi ? SCOM utilise la base tempDB, qui a la collation de l’instance. Cela peut donc engendrer des effets de bords.
Cette information est rare, je dirais même que l’information n’existe pas de façon explicite, voilà qui est chose faite!

——————————————————————–
Bonjour M. Chateau,
Suite aux diverses conversations avec le groupe produit, il en ressort lefait d’avoir des collations différentes
entre la TEMPDB et la base SCOM génère des effets de bord tant au niveau du traitement qu’au niveau des performances.
De plus la collation SQL_Latin1_General_CP1_CS_AS est la seule a avoir été testée et approuvée donc que nous supportons.

Complément de l’équipe produit SCOM US:
——————————
SCOM is a very complicated product, and you want to stay with what’s tested in 100% of all cases.
A dedicated SQL server should also generally be used for SCOM, so I do not see any reason not to use the default collation,
unless this is for a proof of concept, or a very small (shared sql) installation.
If OpsMgr and TempDB differ in collation, your management group will be unusable.
As long as TempDB and OperationsManager, and OperationManagerDW are all SQL_Latin1_General_CP1_CS_AS, there should not be a problem.
I don’t think changing the collations is supported, There are known issues if the tempdb has a different collation than the Ops DB.
If both DB’s had the same collation, I am not aware of any known issues, but this is an untested scenario.

——————————
Dans le cadre d’une infrastructure telle que vous nous me l’avez décrite (50 agents), en général  la base SCOM n’a pas besoin installé sur un serveur dédié.
Ainsi le serveur SCOM peut être installé sur la même machine que sa base.
Si vous avez besoin d’autres éclaircissement n’hésitez pas à me contacter.

Cisco ASA / VPNSSL: unable to send authentication message.

Si vous mettez en oeuvre un accès distant Cisco « 2.0 », c’est à dire à travers un tunnel SSL, avec ou sans client, vous aurez peut être ce message d’erreur.

L’erreur de configuration est triviale, mais l’absence d’information sur ce message d’erreur spécifique rend le diagnostique plus loin qu’il ne devrait!

Ce message apparait autant depuis le webvpn, que le client AnyConnect:

Le problème, au moins dans mon cas, était l’absence de groupe de serveurs pour l’authentification (positionné à None au lieu de LOCAL:

Et voilà!

Notepad++: pourquoi faire compliquer quand on peut faire simple

Mon besoin était simple: j’avais un fichier avec 90 lignes de noms d’extensions de fichiers à mettre sur une seule ligne de texte. Après avoir chercher à le faire avec des expressions régulières, je me suis rendu compte que Notepad++ prévoit déjà ce cas de figure: ctrl + J

Il suffit donc de sélectionner les lignes à joindre ensemble, et de faire le raccourci clavier!

gestion des attributs mp3: Fixtunes c’est génial

Je cherchais depuis longtemps un outil à la fois efficace et ne demandant pas d’effort. J’ai trouvé mon bonheur: FixTunes. Ils proposent à la fois une version intégrées à Itunes d’Apple et une version standalone. Leur base de données est un aggrégat de plusieurs sources. Un taux de réussite est estimé, permettant de ne changer automatiquement que ceux ayant une forte probabilité. Le lui ai soumis une petite centaine de mp3 crados, là ou TheGodFather & co échouent. Il a pratiquement tout trouvé tout seul :). Il corrige l’auteur, l’album, le titre, la catégorie et ajoute la jaquette! Il supprime aussi les doublons!

Le poids des mots, le choc des captures d’écran:

24$ pour ce genre de service, je trouve ça bon marché !

C’est par ici :

Database Tuning Engine Advisor

Je viens d’apprendre deux choses avec le MS SQL 2005 Database Tuning Engine Advisor à mes dépends.
Je vais donc les partager avec vous afin que cela ne vous arrive pas! Le contexte: Je ne m’occupe pas en général de SQL 2005 (ou m’occupais pas jusqu’à présent). Ayant un problème de perf important sur une de nos futures applications, j’ai utilisé SQL Profiler pour capturer l’activité, et j’ai voulu ensuite utiliser DTA pour savoir s’il manquait des index. Mais je suis allé trop vite, et je n’ai donc pas compris que DTA ne pouvait pas utiliser la trace.

Lorsque vous donnez un fichier trace à DTA, vous pouvez lui spécifier la base de workload, et la ou les bases à optimiser. Je pensais bien faire en sélectionnant la base « tune » comme base de workload. J’ai bien vu quelques erreur après l’analyse sur des requêtes, mais rien n’indiquait un problème majeur:

[Microsoft][SQL Native Client][SQL Server]Could not find stored procedure  XX.P_TM_XXXXXXXXXXXXXXXX’.

Ce message est dû au fait que la trace ne contient pas de « use my_database » avant l’appel aux procédures stockées. DTA ne trouve donc aucune procédure stockée, et n’analyse donc rien les concernants. Ca m’étonnait qu’il ne trouve aucun index ni stats à créer, mais je ne savais pas l’expliquer. Pour palier à cela, il faut donc choisir la base où sont ces procédures stockées ou jouées les requêtes en tant que base de workload.

Une fois ce message d’erreur passé, j’en ai eu un deuxième,car les problèmes viennent toujours à plusieurs:

[Microsoft][SQL Native Client][SQL Server]SHOWPLAN permission denied in database ‘XXXXX’.

Celui-là est un peu différent. Si la trace contient la colonne LoginName ou NTUserName, DTA rejoue les requêtes avec ce ou ces comptes, qui doivent donc avoir les droits de faire un showplan. Pour palier à ce problème sans donner ce droit, vous pouvez ouvrir la trace, supprimer ces colonnes, et enregistrer la trace sous un autre nom, le temps de jouer DTA. Ainsi il utilisera le compte avec lequel vous l’exécuter pour analyser les requêtes 🙂

Et voilà, maintenant il me propose l’ajout de 50 index, 125 statistiques pour une estimation de +50% en perf!!

Je vais aux TechED :)

Je fais en effet partie des « quelques » français qui vont aux TechED. L’année dernière, nous étions 80 sur les 4500 personnes présentes ! Même la Grèce avait un bus pour la soirée organisée par pays, sauf la France !

Je compte poster quelques photos, notamment sur le keynote!

PS: Si certains de mes lecteurs vont au techED, envoyez-moi un mail !

Bienvenue sur mon nouveau serveur!

Voilà, je viens de migrer sur ma nouvelle Dedibox ! Après pas mal d’hésitation, je reste sur l’entrée de gamme, passant juste de la V1 à la V2 Standard. J’ai fortement hésité pour la Dedibox PRO, mais j’ai des doutes sur la possibilité d’y mettre un hyperviseur (ESXi ou celui de Microsoft). Sans compter qu’ils n’ont pas ce type de box en stock, et qu’attendre 15 jours, bof !
Je profite de cette « migration » pour changer d’OS, passant de FreeBSD à Debian R4 64 bit. Pourquoi ce changement ? Parce que je compte bien jouer un peu avec VMWare Server sur cette dedibox ! 🙂