<div dir="ltr"><div dir="ltr"><br></div><br><div class="gmail_quote"><div dir="ltr" class="gmail_attr">On Mon, Sep 6, 2021 at 4:49 AM Niklas Schnelle <<a href="mailto:schnelle@linux.ibm.com">schnelle@linux.ibm.com</a>> wrote:<br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex"> I believe we might be the first<br>
implementation of PCI device recovery in a virtualized setting requiring us to<br>
coordinate the device reset with the hypervisor platform by issuing a disable<br>
and re-enable to the platform as well as starting the recovery following<br>
a platform event.<br></blockquote><div><br></div><div>I recall none of the details, but SRIOV is a standardized system for sharing a PCI device across multiple virtual machines. It has detailed info on what the hypervisor must do, and what the local OS instance must do to accomplish this.  It's part of the PCI standard, and its more than a decade old now, maybe two. Being a part of the PCI standard, it was interoperable with error recovery, to the best of my recollection. At the time it was introduced, it got pushed very aggressively.  The x86 hypervisor vendors were aiming at the heart of zseries, and were militant about it. <br></div></div><div class="gmail_quote"><br></div><div class="gmail_quote">-- Linas<br clear="all"></div><br>-- <br><div dir="ltr" class="gmail_signature"><div dir="ltr"><div>Patrick: Are they laughing at us?</div><div>Sponge Bob: No, Patrick, they are laughing next to us.</div><div> <br></div><br></div></div></div>